Après un défaut de conception, les accélérateurs GPU Blackwell de Nvidia connaissent un problème de surchauffe comme l’indique The Information (sur abonnement). Le média indique que des clients comme Meta, Google ou Microsoft ont exprimé de sérieuses inquiétudes à ce sujet, craignant que cela retarde la construction de leurs infrastructures pour l'intelligence artificielle. Le problème de surchauffe proviendrait de la conception des racks de serveurs accueillant les GPU B200. Pour mémoire, l’accélérateur est gravé en 4 nm chez TSMC (une version affinée du procédé utilisé pour Hooper) et comprend 208 milliards de transistors répartis sur deux dies contenants chacune 104 milliards de transistors reliés par des interconnexions NVLink 5.0. Lors de la présentation du GPU, Nvidia avait dévoilé le système GB200 NVL72 comprenant 36 Superchips Grace Blackwell (72 GPU Blackwell et 36 CPU Grace sur base Arm). Ces systèmes peuvent consommer jusqu’à 120 kW par rack.
Nvidia temporise
Toujours selon The Information, Nvidia a réévaluer à plusieurs reprises la conception de ses designs de rack (4U), car la surchauffe entraîne un baisse des performances des GPU et risque d’endommager les composants. La société aurait demandé à ses fournisseurs d’apporter plusieurs modifications dans le design des armoires et l’optimisation du refroidissement liquide. Cette affaire prend de l’ampleur, car elle a contribué au retard dans les dates de livraisons prévues des GPU Blackwell. A l’origine, ils devaient être disponibles au second semestre 2024 et la date a été repoussée à début 2025.
Dans un message publié par Reuters, Nvidia a minimisé le problème en indiquant « travailler avec les principaux fournisseurs de services cloud comme partie intégrante de notre équipe d'ingénieurs et de notre processus ». Et d’ajouter « les itérations d’ingénierie sont récurrentes et attendues ». Pour mémoire, Les superpuces GB200 Grace Blackwell devraient coûter jusqu'à 70 000 dollars l'unité, tandis que le prix d'un rack de serveur complet dépasse les 3 millions de dollars.
Commentaire