Il y a comme un air de convergence sur l’infrastructure dédiée à l’IA. C’est le sentiment donné à l’annonce lors du Cisco Live qui se déroule à Las Vegas cette semaine du Nexus HyperFabric AI Clusters. Dans ce cadre, la firme américaine poursuit et approfondit sa collaboration avec Nvidia, acteur majeur dans l’IA pour présenter une pile complète pour que les entreprises puissent créer, déployer et surveiller leurs applications IA et de GenAI. L’infrastructure ainsi présentée peut s’installer sur site ou dans un cloud privé.
Dans le détail, les clusters Nexus HyperFabric AI combinent plusieurs éléments pour adresser le calcul, le réseau et le stockage. Sur la partie réseau, on retrouve des commutateurs de la série Nexus 6000 pour le backbone Ethernet en proposant des connectivités 400G et 800G. La gestion des switchs se fera depuis le cloud via le tableau de bord du Nexus et Intersight. La volet réseau est optimisée par le DPU BlueField-3 de Nvidia capable de décharger le CPU des tâches de traitement réseau. Pour mémoire, BlueField est une carte réseau de type SmartNIC qui résulte de l'acquisition de Mellanox par Nvidia.
Le cluster Nexus HyperFabric AI de Cisco est une stack comprenant des éléments de Nvidia et Vast Data. (Crédit Photo: Cisco)
Vast Data apporte sa Data Platform
Sur la partie compute, Cisco apporte ses serveurs UCS notamment les M7 qui plus tôt dans l’année ont fait l’objet d’un travail en commun avec Nvidia pour intégrer les accélérateurs GPU dont le H200 NVL. Dans cette architecture, Nvidia fournit son logiciel AI Enterprise avec les microservices NIM pour l’inférence. Enfin sur la couche stockage, le duo a fait confiance à Vast Data et sa plateforme de données unifiées présentée à l’été 2023. Elle a été conçue pour gérer tous types de données non structurées et structurées (vidéo, d'images, texte, data stream, ...) générées partout dans le monde et traitées en temps réel. Elle comprend 4 piliers DataStore (une architecture de stockage évolutive pour les données non structurées qui élimine la hiérarchisation du stockage), DataBase (couche de base de données sémantique intégrée de manière native). Ainsi que DataEngine (moteur d'exécution supportant SQL et Python couplé à un système notification d'événements et facilitant la gestion des pipelines d'IA) et DataSpace (stocker, extraire et traiter des données provenant de n'importe quel site avec des performances élevées tout en assurant une cohérence stricte entre tous les points d'accès).
Les clusters Nexus HyperFabric AI seront disponibles pour certains clients à partir du quatrième trimestre 2024. La disponibilité générale suivra peu après assure l’équipementier. Par ailleurs, la société prévoit d’ouvrir cette infrastructure à d’autres acteurs du stockage comme Pure Storage et Netapp. Cisco travaille déjà avec ces deux acteurs autour de FlashStack AI pour le premier et FlexPod AI pour le second. Tous les acteurs de l’infrastructure se mettent en ordre de bataille autour de l’IA comme le montre les récentes annonces Dell Technologies sur son IA Factory ou HPE et son architecture IA native.