Cette fois, c'est fait. Le supercalculateur Aurora, fruit d'une collaboration entre le département américain de l'énergie (DoE), Intel et HPE (via sa filiale Cray) localisé dans le laboratoire national d'Argonne dans l'Illinois, a été entièrement assemblé. Ce dernier contient pas moins de 21 248 CPU Intel Xeon Max Series (HBM) et 63 744 GPU Max Series (Xe-HPC) répartis dans 10 624 lames contenues dans 166 racks. Un monstre de puissance dont la performance théorique maximale en pic est censée dépasser les 2 exaflops avant fin 2023. « Aurora est le premier déploiement de GPU de la série Max d'Intel, le plus grand système basé sur le CPU Xeon Max Series et le plus grand cluster de GPU au monde. Nous sommes fiers de faire partie de ce système historique et nous nous réjouissons de l'IA révolutionnaire, de la science et de l'ingénierie qu'Aurora va permettre », s'est félicité Jeff McVeigh, vice-président d'Intel et directeur général du Super Compute Group.
Intel avait présenté les spécifications hors normes du système Aurora en mai dernier. (Crédit Photo: Intel)
Les spécialités d'Aurora dans le calcul haute performance sont dans la simulation, l'analyse de données et l'intelligence artificielle pour des traitements à très grande échelle. Le système comprend plus de 1 024 nœuds de stockage, fournissant 220 Po de capacité pour une bande passante totale de 31 téraoctets par seconde en s'appuyant sur la solution d'interconnexion réseau haute performance HPE Slingshot.
Finalisation de l'installation d'une des 10 624 lames composant le supercalculateur Aurora du département américain de l'énergie localisé au laboratoire national d'Argonne dans l'Illinois. (crédit : Intel)
Des modèles d'IA générative entrainés à grande échelle
« Pendant que nous travaillons sur les tests de montée en charge, nous allons utiliser Aurora pour entraîner des modèles d'IA générative à grande échelle pour la science », a par ailleurs expliqué Rick Stevens, directeur associé du laboratoire national d'Argonne. « Aurora, avec plus de 60 000 GPU Intel Max, un système d'E/S très rapide et un système de stockage performant, est l'environnement idéal pour entraîner ces modèles ».
Avec cette puissance de calcul, Aurora devrait parvenir sans souci à prendre dans les prochains mois la première place du classement Top500 des supercalculateurs jusqu'alors détenue par Frontier, également exploité par le ministère américain de l'Energie mais tournant notamment sur des CPU et accélérateurs... d'AMD. Pour l'heure sa capacité maximale frôle les 1,2 exaflop. Dans la course à la puissance, est également attendu au tournant le plus grand supercalculateur dédié à l'IA de Meta, SAI Research SuperCluster, dont la puissance théorque maximale était annoncée à 5 exaflops.