Pour rattraper Nvidia (proposant des systèmes GPU associés à Infiniband), Intel intensifie ses efforts pour pousser ses solutions pour l'IA dans les réseaux d'entreprise, les centres de données, les serveurs et autres appareils en périphérie. Lors de son événement Intel Vision 2024, le géant des puces a annoncé des plans pour des cartes réseau Ethernet (NIC) basées sur les futures spécifications de l'Ultra Ethernet Consortium (UEC), des processeurs Xeon 6 à hautes performances et l'accélérateur Gaudi 3, destiné aux charges de travail d'entraînement et d'inférence IA, mais aussi de GenAI à grande échelle. « Notre objectif ultime est de fournir des systèmes d'IA qui s'étendent de l'API à l'IoT dans l’industrie, de la périphérie jusqu'au centre de données, et de faciliter l'adoption et l'utilisation efficaces de l'IA par les entreprises en général », a déclaré Sachin Katti, vice-président et directeur général du groupe réseau et périphérie chez Intel. Un large éventail de puces de connectivité Ethernet pour IA et de cartes réseau Ethernet pour IA sont prévues pour l'intégration dans les XPU, les systèmes d'accélération basés sur Gaudi et une gamme de conceptions d'interconnexion d'IA (logicielle et matérielle) pour Intel Foundry, a déclaré M. Katti.
Les systèmes basés sur Ethernet adhéreront aux critères ouverts de fabric réseau de l'UEC qui devraient être publiés plus tard cette année. Intel est l'un des fondateurs de l'UEC, qui compte aujourd'hui plus de 50 fournisseurs développant des technologies visant à accroître l'évolutivité, la stabilité et la fiabilité des réseaux Ethernet afin de répondre aux exigences de réseau haute performance nécessaire à l'IA. Les spécifications de l'UEC porteront sur diverses améliorations évolutives d'Ethernet, notamment de meilleures options de multi-acheminement et de distribution de paquets, ainsi que des fonctionnalités modernes de gestion des congestions et de télémétrie.
Cette infographie d'Intel résume assez bien les principales caractéristiques de l'architecture XPU Gaudi 3. (Crédit Intel)
Une concurrence frontale avec l'accélérateur H100 de Nvidia
Prenant pour cible Nvidia, Intel a détaillé la puce d'accélération IA Gaudi 3 (gravé en 5 NM chez TSMC) , qui, selon elle, est 40 % plus économe en énergie en moyenne que les puces Nvidia H100 similaires. "L'accélérateur d'IA Intel Gaudi 3 alimentera des systèmes d'IA comptant jusqu'à des dizaines de milliers d'accélérateurs connectés via le standard commun d'Ethernet ", a déclaré Intel. Par exemple, 24 ports Ethernet 200 gigabits sont intégrés dans chaque accélérateur Intel Gaudi 3, offrant une mise en réseau flexible et standard. Il promet d'offrir 4 fois plus de capacités de calcul IA et une bande passante mémoire 1,5 fois supérieure à son prédécesseur, le Gaudi 2, ce qui permettra un dimensionnement efficace pour prendre en charge des grappes de calcul volumineuses et éliminer le verrouillage propriétaire des équipementiers grâce aux infrastructures réseau exclusives, souligne Intel. L'idée est que l'accélérateur puisse offrir une performance décuplée pour les modèles d'entraînement et d'inférence IA, offrant aux entreprises un choix plus large de systèmes à déployer lors du passage à l'IA générative à grande échelle, a déclaré M. Katti.
Benjamin Lee, professeur à l'école d'ingénierie et de sciences appliquées de l'université de Pennsylvanie, estime toutefois que la trajectoire d'Intel n'est pas facile et que la société doit relever des défis pour rester compétitive face à Nvidia. "Intel a longtemps dominé la conception et la fabrication de processeurs de haute performance, mais les défis récents reflètent des changements fondamentaux dans le paysage informatique", a expliqué l'universitaire. " Les centres de données continueront à déployer des CPU en grand nombre pour soutenir les services Internet et l'informatique cloud, mais ils déploient de plus en plus de GPU pour soutenir l'IA, et Intel a eu du mal à concevoir des GPU compétitifs."
Avec son accélérateur Gaudi 3, Intel annonce une inférence améliorée de 50 % en moyenne et une efficacité énergétique améliorée de 40 % en moyenne par rapport au Nvidia H100 - pour une fraction du coût. (Crédit Intel)
Les puces Xeon 6 dévoilées
En plus du support de l'UEC, Intel a annoncé un plan - en collaboration avec SAP, Red Hat, VMware et d'autres - pour créer une plateforme ouverte afin d'accélérer le déploiement de systèmes d'IA générative sécurisés pour les entreprises. L'idée est de garantir que lorsque les sociétés construisent des systèmes d'IA, elles disposent d'une connectivité réseau ouverte et basée sur des standards afin de pouvoir déployer des modèles d'IA à grande échelle en toute sécurité, a déclaré M. Katti.
Intel a également présenté les processeurs Xeon 6 - la firme a abandonné l'appellation Scalable 6eme génération - offrent une amélioration des performances de 4x et une densité de rack presque 3x meilleure par rapport aux processeurs Intel Xeon de deuxième génération, selon le fondeur. Ce dernier souligne que les puces Xeon 6 donneront aux entreprises la puissance nécessaire pour prendre en charge l'entraînement à l'IA et des fonctionnalités telles que la génération augmentée par la récupération (RAG), qui consiste à récupérer des données de l'entreprise pour actualiser et rendre plus précis les LLM.
Les partenaires habituels d'Intel sur les rangs
Le Gaudi 3 sera disponible pour les fabricants d'équipement d'origine au deuxième trimestre 2024 dans des configurations standard de carte mère universelle et de module d'accélération ouvert (OAM). Dell Technologies, Hewlett Packard Enterprise, Lenovo et Supermicro font partie des fournisseurs qui intégreront Gaudi 3 dans les serveurs et autres équipements. La disponibilité générale des accélérateurs Gaudi 3 est prévue pour le troisième trimestre 2024. Pour les Xeon 6, ils devraient être disponibles au deuxième trimestre 2024.