« Nous devons trouver une solution viable pour dépasser la loi de Moore », a déclaré le CEO de Nvidia, Jen-Hsun Huang, en ouverture de la conférence annuelle GPU Technology qui se tient du 8 au 11 mai dans la Silicon Valley à San José. En attendant, Nvidia n'hésite pas à investir pour démultiplier la puissance de ses processeurs graphiques, comme en témoigne la première puce basée sur son GPU Volta de prochaine génération. Les processeurs graphiques haut de gamme « Pascal » de Nvidia sont toujours les plus performants, au moins jusqu’à l’arrivée des GPU Radeon Vega par AMD prévue avant la fin du mois de juin. Même si le GPU Tesla V100 est destiné aux datacenters, la présentation de Volta permet à Nvidia de détourner un peu l’attention sur la puce de son rival.
Le GPU Volta est vraiment énorme, aussi bien en taille qu’en fonctionnalités. Il comprend 21 milliards de transistors et 5 120 cœurs CUDA tournant à une vitesse d'horloge de 1,455 GHz. La fabrication est basée sur un processus de gravure à 12 nanomètres plus évolué que celui utilisé pour les GPU actuels de Nvidia. Comparativement, la puce Tesla P100 à 14 nm, son GPU phare de la série Pascal, comprend 3 840 cœurs CUDA et 15 milliards de transistors. Quant à la puce GeForce GTX 1060, elle comprend le quart de cœurs CUDA - 1 280 exactement - de la Tesla V100. Toute la technologie de la Tesla V100 tient dans un carré de 815 mm, contre 600 mm pour la Tesla P100 ! Volta atteint « les limites de la photolithographie », a ironiquement déclaré le CEO de Nvidia à propos de la puce dont le développement a concentré un budget R&D de plus de 3 milliards de dollars.
La nouvelle puce graphique Tesla V100 de Nvidia basée sur Volta (Crédit : Nvidia)
Jusqu'à 120 téraflops
Nvidia a déclaré qu’il avait redessiné l'architecture de diffusion de Volta pour qu’elle gagne 50% de performance en plus par rapport à Pascal. Si cela se confirme, le résultat sera impressionnant, avec « des améliorations majeures dans les performances FP32 et FP64 avec un même GPU », comme l’a affirmé Nvidia. Le Tesla V100 comprend également de nouveaux « noyaux de tenseur » construits spécifiquement pour le deep learning. « Ils multiplient par 12 le débit en téraflops du Tesla P100 basé sur Pascal », a déclaré le CEO de Nvidia. (Google a également investi dans le développement d’un hardware de traitement basé sur un système de tenseurs). Les pics de performance atteints par le Tesla V100 sont les suivants : 7.5 téraflops en performance en virgule flottante à double précision (FP64), 15 téraflops en performance à simple précision (FP32) et 120 téraflops en précision mixte pour les opérations de multiplication et d’accumulation de matrice pour les noyaux de tension.
L’énorme GPU Volta à l’intérieur du Tesla V100 (Crédit : Nvidia)
Le Tesla V100 utilise 16 Go de mémoire ultra-rapide avec une largeur de bande de 4 096 bits pour assurer un traitement rapide des données. On ne sait pas encore si les cartes graphiques grand public basées sur Volta seront équipées de mémoire HBM2 (High Bandwitch Memory, Second Generation). Ce sera le cas de la Radeon Vega, mais la technologie est encore relativement nouvelle et coûteuse. Les premières cartes graphiques GeForce GTX séries 10 étaient équipées de la nouvelle technologie GDDR5X basée sur des designs de mémoire classiques. Récemment, SK Hynix a déclaré qu'il « lancerait une production en masse pour le compte d’un client qui prévoie de mettre sur le marché une carte graphique haut de gamme intégrant de la DRAM GDDR6 haute performance d'ici le début de l’année 2018 ». Selon Nvidia, cette mémoire HBM2 atteint des vitesses de 900 Go/s. De plus, le Tesla V100 sera doté de la technologie NVLink de seconde génération de Nvidia. Avec une vitesse de transfert de 300 Go/s, Jen-Hsun Huang affirme que NVLink est désormais 10 fois plus rapide que les connexions PCIe standard.
Légende : L'intérieur du Tesla V100 (Crédit : Nvidia)
Il est possible d’avoir plus de détails sur le datacenter et l'architecture Volta, en consultant le document explicatif Tesla V100 de Nvidia. Au troisième trimestre, et plus largement au quatrième trimestre, Nvidia lancera une version améliorée de son coûteux système de Deep Learning DGX-1 avec le GPU Tesla V100 en remplacement du GPU Pascal, .