IBM Cloud élargit ses services technologiques d'IA avec les puces d'IA Intel Gaudi 3 désormais disponibles pour les entreprises. Avec les accélérateurs Gaudi 3, les clients peuvent tester, déployer et faire évoluer les modèles et applications d'IA d'entreprise de manière plus rentable, selon big blue, qui serait le premier fournisseur de services cloud à adopter Gaudi 3. Selon la firme d'Armonk, ces accélérateurs comprennent des conceptions et des fonctionnalités spécifiques à l'IA et sont destinés au développement de modèles de langage de grande taille (LLM) multimodaux et à la génération augmentée de récupération (RAG). Les accélérateurs sont dotés de moteurs mathématiques matriciels, de cœurs de traitement tensoriel, d'une mémoire à large bande passante et de ports Ethernet intégrés pour l'inférence accélérée des réseaux neuronaux profonds, selon IBM. « Les entreprises peuvent passer d'un seul nœud (huit accélérateurs) avec un débit de 9,6 To/s à un cluster de 1 024 nœuds (8 192 accélérateurs) pour un débit de 9,830 Po/s. La mise à l'échelle est réalisée en utilisant un choix de nombreux commutateurs Ethernet standard et à haute capacité et d'autres infrastructures de soutien pour aider à réduire les coûts », a indiqué IBM.
Les Gaudi 3 peuvent être déployés via IBM Cloud Virtual Servers pour des instances de cloud privé virtuel (VPC). Les entreprises ont la possibilité de choisir leurs ressources de calcul, de stockage et de réseau en fonction de leurs besoins, a précisé big blue. En outre, le package peut être fourni sous la forme d'un container node, et IBM Cloud a déclaré qu'il prévoyait de fournir Gaudi 3 en tant que nœud de travail pour les clusters Red Hat OpenShift AI et Red Hat OpenShift sur IBM Cloud début 2025. Les instances Gaudi 3 prennent également en charge les options d'image Red Hat Enterprise Linux AI.
Les puces Gaudi 3 concurrencent les GPU H100 et H200
Pour les entreprises qui ont besoin de plus de contrôle sur leur développement de l'IA, IBM indique qu'elles pourront déployer le logiciel Watsonx.ai avec le serveur virtuel basé sur Gaudi 3 sur Cloud VPC d'IBM au deuxième trimestre 2025. Watsonx.ai comprend un studio de développement de l'IA de bout en bout, une boîte à outils pour les développeurs d'IA et une gestion complète du cycle de vie de l'IA pour développer des services d'IA et les déployer dans les applications des clients. « Alors que l'IA passe de plus en plus d'une tendance expérimentale à l'épine dorsale des applications du monde réel, les organisations informatiques sont confrontées au défi d'équilibrer les performances nécessaires avec les considérations économiques du matériel d'IA, et ce à grande échelle », a écrit Mitch Lewis, analyste des performances chez Signal65, qui propose des tests, des validations de performances et des conseils basés sur les données pour l'industrie technologique.
« Une analyse précédente de Signal65 a démontré que les accélérateurs Gaudi 3 étaient capables d'offrir des performances hautement compétitives pour les charges de travail d'inférence IA, tout en offrant des avantages économiques substantiels. La disponibilité des accélérateurs d'Intel sur IBM Cloud semble s'appuyer sur ces avantages tout en fournissant aux entreprises une approche basée sur le cloud, facilement accessible et évolutive, pour le déploiement d'applications IA », a écrit Lewis dans un billet de blog sur la mise en œuvre de l'accélérateur IA Intel Gaudi 3 sur IBM Cloud. « Ces tests de performance préliminaires menés par Signal65 ont montré qu'Intel Gaudi 3 offrait des performances très compétitives par rapport aux autres offres basées sur Nvidia sur IBM Cloud. Gaudi 3 sur IBM Cloud fournit une plateforme flexible capable d'atteindre des performances élevées sur différents modèles et configurations techniques », a écrit Lewis. « De plus, le prix des instances Gaudi 3 sur IBM Cloud constitue un avantage économique intéressant par rapport aux deux types d'instances Nvidia » - avec les GPU H100 et H200 - qu'IBM Cloud prend également en charge, a déclaré Lewis.
Commentaire