Nvidia présente l'architecture GPU Rubin et partage son approche de l'IA physique

« Je ne sais pas encore si je vais le regretter », a déclaré Jensen Huang, le CEO de Nvidia, en dévoilant les plans de sa plateforme GPU Rubin pour 2026.

C’est lors de son discours d'ouverture du salon Computex, qui s'est achevé au début du mois, que Jensen Huang, le CEO de Nvidia, a dévoilé sa prochaine plateforme GPU Rubin accélérant l'IA, dont la livraison est prévue pour 2026. Rubin fera suite à la génération Hopper commercialisée actuellement et à la prochaine génération Blackwell attendue à la fin de cette année. Donc, en 2026, l'architecture Rubin succèdera à la plateforme Blackwell Ultra, dotée de performances accrues pour l'architecture d’IA, que Nividia livrera l’an prochain. À noter que, pour la dénomination de ses produits, le fournisseur de Santa Clara a pris l’habitude de choisir les noms de scientifiques célèbres. La prochaine architecture portera le nom de l’astronome Vera Rubin.

Au Computex, M. Huang ne s’est pas étendu sur Rubin. En fait, il s'est même demandé s'il devait l'annoncer. « Je ne sais pas encore si je vais le regretter ou pas », a-t-il déclaré à l'auditoire. Son hésitation s’explique peut-être par ce que l'on appelle l'effet Osborne, selon lequel l'annonce par une entreprise de la prochaine version d'un produit technologique incite les clients à ne plus acheter le produit actuel. Mais voilà ce que l’on sait : la plateforme Rubin AI utilisera la mémoire HBM4 (qui n'est même pas encore sortie) et le commutateur NVLink 6, fonctionnant à 3 600 Gbps. Le CEO a également présenté un CPU appelé Vera, basé sur Arm, qui sera intégré à une carte accélératrice appelée Vera Rubin, tout comme les puces Grace Hopper combinent un CPU Grace et un GPU Hopper.

La robotique, prochaine étape de l'IA

Même si M. Huang a donné peu de détails techniques sur la plate-forme Vera Rubin, il a fait la prédiction audacieuse suivante : l'IA de demain sera « une IA physique », c'est-à-dire une IA qui comprend les lois de la physique et qui peut travailler de concert avec les humains. « Un jour, tout ce qui bouge sera autonome », a-t-il affirmé. « Pour que cela devienne possible, l'IA physique doit comprendre le modèle du monde, comment l’interpréter, comment le percevoir. Cette IA doit avoir d'excellentes capacités cognitives pour pouvoir nous comprendre, comprendre ce que nous demandons et effectuer les tâches à venir », a-t-il ajouté. « Toutes les usines seront robotisées, elles orchestreront des robots, et ces robots construiront des produits robotisés. Les robots interagiront avec les robots, construiront des produits robotisés. Pour y parvenir, nous devons innover encore plus », a-t-il poursuivi avant de montrer une vidéo de démonstration de chercheurs développant des robots alimentés par cette IA physique.

Les IA physiques utilisent des LLM multimodaux qui permettent aux robots d'apprendre, de percevoir et de comprendre le monde qui les entoure et de planifier leurs actions. L'une des technologies intégrales qui sert à faire progresser la robotique est l'apprentissage par renforcement. Elle s'appuie sur le feedback de l'homme pour acquérir des compétences particulières. Cependant, dans la vision de Nvidia, l'IA physique générative peut acquérir des compétences en utilisant l'apprentissage par renforcement à partir du feedback provenant d’un monde simulé plutôt que des humains eux-mêmes. « Dans ces environnements de simulation, les robots peuvent s’entraîner à prendre des décisions en effectuant des actions dans un monde virtuel qui obéit aux lois de la physique. Dans ces gymnases pour robots, un robot peut apprendre à exécuter des tâches complexes et dynamiques rapidement et en toute sécurité, en affinant ses compétences grâce à des millions d'essais et d'erreurs », a expliqué M. Huang.

Des mises à jour annuelles pour les accélérateurs d’IA

L’annonce d'une nouvelle architecture n'est pas vraiment une surprise, car Nvidia a récemment déclaré qu'elle souhaitait livrer des architectures tous les ans au lieu de tous les deux ans. Cet objectif, qui consiste à mettre à jour une technologie GPU qui comporte déjà des milliards de transistors, est extrêmement ambitieux et ne laisse aucune place à l'erreur. AMD a dit qu'elle adopterait une cadence similaire pour sa gamme Instinct. « Notre cadence sera annuelle et notre philosophie de base est très simple : construire un centre de données complet à l'échelle, désagréger et vendre des composants à une année de distance, et pousser le tout jusqu'aux limites de la technologie », a avancé M. Huang. C'est cette approche qui explique la montée en flèche de l'action Nvidia, que la valeur de son marché a dépassé les 3 000 milliards de dollars et que la fortune estimée de M. Huang a dépassé les 100 milliards de dollars.