Nvidia fait feu de tout bois pour sa conférence développeurs GTC 2023 (20-23 mars). Aux côtés de ces tous derniers systèmes DGX H100 embarquant huit GPU H100, le fournisseur américain a dévoilé son offre d'infrastructure as a service, DGX Cloud sur lesquels tourneront notamment sa dernière salve de logiciels AI Foundations.
DGX est le nom des offres à destination du calcul haute performance (HPC) et l'IA dont l'un des premiers modèles a été livré en 2016 à Open AI, développeur de l'emblématique application d'IA générative ChatGPT. La moitié de toutes les entreprises du Fortune 100 ont désormais leurs propres solutions DGX, selon le fournisseur. AWS, Google Cloud, Microsoft ou encore Oracle se sont d'ailleurs montrés très intéressés pour proposer un accès aux GPU H100 sur lesquels le DGX est construit. D'ici quelques mois, les entreprises qui ne souhaitent pas acheter leur système DGX auront la possibilité de louer des clusters de GPU H100 au mois via le service DGX Cloud, hébergé par les partenaires hyperscalers de Nvidia. C'est le cas d'Oracle qui peut prendre en charge des milliers d'instances OCI Compute Bare Metal avec des dizaines de milliers de GPU Nvidia A100 pour traiter des applications massivement parallèles. « La mise en réseau OCI Supercluster peut désormais évoluer jusqu'à 4 096 instances OCI Compute Bare Metal avec 32 768 GPU A100 », a déclaré Karan Batta, vice-président des produits chez Oracle. « OCI prévoit de proposer des instances Compute Bare Metal avec des GPU Nvidia H100 plus tard cette année ». De son côté Azure prévoit d'héberger DGX Cloud au prochain trimestre. Google Cloud s'est engagé à la faire prochainement.
Le train de l'IA générative en marche
Les DSI utilisent probablement déjà du matériel, des logiciels et des services de Nvidia pour prendre en charge les applications compatibles avec l'IA dans leur entreprise. Mais ils peuvent être amenés à approfondir leur usage dans ce domaine et le fournisseur espère bien qu'ils continueront à le faire avec son aide même si cela à un coût. « Les services et solutions IA peuvent être coûteux ce qui peut amener les entreprises à des arbitrages au regard des performances qui varient en fonction des différents fournisseurs du marché », a expliqué Shane Rau, vice-président de la recherche en semic-conducteurs d'IDC.
Alors que le train en marche de l'IA générative s'accélère, Nvidia promet par ailleurs des outils pour accompagner cette rapidité. Son CEO, Jensen Huang, a ainsi expliqué l'arrivée d'une série de nouveaux services pour les entreprises afin de former et d'exécuter leurs propres modèles d'IA générative. « Lorsqu'ils arriveront sur le marché, ils ouvriront plus d'options sur le continuum build-vs-buy pour les DSI appelés à prendre en charge les workload d'entraînement à l'IA. Cela ne signifie pas qu'ils peuvent simplement déléguer la responsabilité de l'infrastructure d'IA », a déclaré Shane Rau, vice-président de la recherche couvrant les puces de traitement de données pour IDC. « Les DSI devraient déjà comprendre que l'IA n'est pas à taille unique », a-t-il déclaré. « La pile de solutions d'IA varie en fonction de la manière dont elle sera utilisée, ce qui implique qu'il faut avoir une compréhension intime du cas d'utilisation de l'IA - les équipes en charge de de sujet et le domaine final dans lequel ils travaillent - et comment cartographier les besoins en terme de ressource, les puces, les logiciels, le matériel système et les services ».
Trois services au coeur de IA Foundations
Nvidia propose des solutions as a service pour répondre à ces problèmes à plusieurs niveaux. Avec AI Foundations en particulier qui est une famille de services cloud avec lesquels les entreprises pourront créer leurs propres grands modèles de langage (LLM), une branche de l'IA générative, et les exécuter à grande échelle, en les appelant à partir d'API Nvidia. Trois services sont proposés au lancement, toujours en accès limité ou en avant-première privée pour le moment : NeMo pour la génération de texte, Picasso pour les visuels, et BioNeMo pour les structures moléculaires. Chacune des trois offres comprendra des modèles pré-formés, des framework de traitement de données, des bases de données de personnalisation, des moteurs d'inférence et des API auxquelles les entreprises pourront accéder à partir d'un navigateur, a expliqué Nvidia.
NeMo, le service textuel, comprend une variété de modèles d'IA pré-formés que les utilisateurs peuvent encore entraîner sur leurs propres données pour les personnaliser avec des connaissances spécifiques au domaine. Le fournisseur de données financières Morningstar étudie déjà comment il peut utiliser NeMo pour extraire des données utiles sur les marchés à partir de données brutes, en s'appuyant sur l'expertise de ses salariés pour ajuster les modèles. Le service Picasso permettra aux entreprises de former des modèles pour générer des images personnalisées, des vidéos et même des modèles 3D dans le cloud. Nvidia s'associe à Adobe pour offrir de telles capacités génératives dans ses outils aux professionnels de la création tels que Photoshop et After Effects.
Blanchiment de droit d'auteur ?
Nvidia cherche à gommer la réputation de l'IA générative (notamment sur la création artistique) qui a eu tendance à prendre plusieurs libertés en matière de droits d'auteur des artistes et des photographes sur les œuvres desquels les modèles sont formés. Certains craignent que l'utilisation de tels modèles pour créer des œuvres dérivées n'expose les entreprises à des poursuites pour violation du droit d'auteur. Nvidia espère ainsi apaiser ces inquiétudes en concluant un accord de licence avec la bibliothèque d'images Getty Images, qui indique qu'elle versera des redevances aux artistes sur les revenus générés par les modèles formés sur les œuvres de sa base de données. Nvidia travaille avec une autre bibliothèque, Shutterstock, pour entraîner Picasso à créer des modèles 3D en réponse à des invites textuelles basées sur des images sous licence dans sa base de données. Ces conceptions 3D seront disponibles pour une utilisation dans des jumeaux numériques industriels fonctionnant sur la plate-forme Omniverse de Nvidia.
Le troisième service d'AI Foundations, BioNeMo, ne traite pas de mots et d'images mais de structures moléculaires. Les chercheurs peuvent l'utiliser pour concevoir de nouvelles molécules et prédire leur comportement. Le fournisseur le destine aux entreprises pharmaceutiques pour la découverte et les tests de médicaments, en l'ajustant avec des données exclusives. La société de biotechnologie Amgen est l'un des premiers utilisateurs de ce service.