Le système de refroidissement par échange thermique HyperCool lancé par Zutacore peut prendre en charge l’accélérateur Grace Blackwell GB200 de Nvidia, composé d’un CPU et de GPU. Taillé pour le HPC et l'IA, Grace Blackwell est une carte dotée de 400 milliards de transistors et de cinq composants, deux GPU Blackwell, un CPU Grace et deux puces d'entrée/sortie I/O. Sa consommation d'énergie est estimée à plus de 1 kW, ce qui rend le refroidissement par air extrêmement difficile. Pour refroidir ce combo, HyperCool utilise un processus d'ébullition et de condensation à deux phases qui déplace de grandes quantités de chaleur hors des serveurs. Les unités de refroidissement sont dotées de capteurs, de pompes et de contrôleurs indépendants, ainsi que d'un système de détection et de prévention des fuites à plusieurs niveaux. L'URC déplace le liquide vers les serveurs et assure une condensation efficace de la vapeur et le rejet de la chaleur qu'elle contient. La conception innovante d'HyperCool permet la réutilisation théorique de la chaleur produite par le centre de données. Surtout, son installation ne nécessite aucune modification du datacenter ou du rack, ce qui est souvent le cas avec les solutions de refroidissement liquide.

Une plaque d'évaporation à contact direct, autorégulée, basée sur le principe du pool-boiling, permettant le refroidissement simultané de toutes les puces. Compact et capable de refroidir des processeurs de 1500 W et plus, elle est qualifiée par les principaux fabricants de processeurs Intel et AMD et déployé dans les principaux fabricants de serveurs, notamment Dell, SuperMicro et Pegatron. (Crédit Zutacore)

Selon ses affirmations, Zutacore est un des premiers à proposer des plaques froides diélectriques adaptées à cette plateforme. En effet, le système de Zutacore est capable de refroidir 120 kW de puissance. Comparativement, le refroidissement par air supporte environ 30 kW de puissance et n'est plus viable au-delà pour refroidir le système.

Ce collecteur autonome qui s'adapte aux baies standard et personnalisées, distribue le liquide réfrigérant à tous les serveurs du rack et redirige la vapeur vers l'unité de rejet de la chaleur. (Crédit Zutacore)

La technologie du fournisseur peut refroidir le superchip Nvidia GB200 avec une seule plaque froide. « C’est la première solution de refroidissement liquide sans eau directement sur puce », a déclaré Erez Freibach, cofondateur et CEO de Zutacore, dans un communiqué. « Avec cette avancée, les propriétaires et les opérateurs de centres de données d'IA peuvent s’affranchir des risques associés au refroidissement à base d'eau, et ils peuvent déployer la puissance de traitement nécessaire aux charges de travail intensives en calcul, en particulier les charges d'IA générative, sans craindre les fuites ». Toujours selon Zutacore, le système HyperCool peut supporter 10 fois plus de puissance de calcul dans les centres de données nouveaux ou existants, il réduit de 50 % le coût total de possession, peut réutiliser 100 % de la chaleur et réduit les émissions de CO2.

 

La plupart des systèmes de refroidissement liquide impliquent l'installation d'une sorte de tuyauterie, mais Zutacore affirme que son système n’en a pas besoin. (Crédit Zutacore)

L’écosystème de serveurs certifiés pour fonctionner avec HyperCool est encore restreint, mais il s’étoffe. C’est le cas des serveurs de Dell Technologies, ASUS, Pegatron et SuperMicro. En plus de son offre axée sur le support de la puce GB200 Grace Blackwell Superchip, Zutacore a récemment dévoilé le support du système HyperCool pour les anciens GPU Nvidia H100 et H200. Par ailleurs, Zutacore a annoncé un accord OEM stratégique avec UNICOM Engineering, un partenaire Dell Titanium, pour fournir des serveurs AI HyperCooled garantis pour les GPU H100 et H200. Zutacore a aussi annoncé qu'un fournisseur mondial d'IA-en-tant-que-service avait déjà choisi son refroidissement liquide HyperCool direct-to-chip pour ses serveurs d'IA. Les déploiements démarreront au troisième trimestre 2024.