A l'occasion du salon l'ISC High Performance 2022, du 29 mai au 2 juin à Hambourg, en Allemagne, Intel a mis en avant le successeur de son accélérateur GPU Ponte Vecchio, que le fondeur a baptisé Rialto Bridge. Attendu en 2023, il était jusqu’à présent connu sous la simple appellation « Ponte Vecchio Next » sur la roadmap du fournisseur (voir ci-dessous). La dernière feuille de route d'Intel, qui s'étale sur trois ans environ, annonce d’ailleurs une convergence entre les CPU et les accélérateurs avec la plateforme désagrégée XPU dont Falcon Shores sera le premier rejeton. Bénéficiant des dernières technologies d’Intel et d’une gravure plus fine, Rialto Bridge a la lourde tâche d’assurer un pont entre Ponte Vecchio et Falcon Shores.
La feuille de route à trois d'Intel pour ses CPU et GPU de classe entreprise. (Crédit Intel)
Principal changement, le nombre d’unités de calcul Xe passe de 128 sur Ponte Vecchio à 160 sur Rialto Bridge. Pour la fabrication, ce dernier utilisera des technologies de gravure plus récentes que le mélange actuel combinant des nœuds TSMC N7 (pour les tuiles de calcul), TSMC N5 (pour les tuiles de Xe Link) et Intel7 (pour la base et le cache). Ce dernier devrait par exemple être remplacé par un procédé Intel4 pour la base et le cache de l’accélérateur. Rialto Bridge a également une différence notable avec son prédécesseur : les unités de calcul bénéficient d’une architecture retravaillée, offrant jusqu'à 30 % de performances supplémentaires dans les applications selon Intel. Ce dernier n'a toutefois pas encore fourni de références pour étayer ces dires. Cependant, le chiffre de 30 % suit de près l'augmentation de 25 % du nombre d'unités de calcul.
160 unités de calcul
Comme indiqué sur le slide ci-dessous - à la différence du Ponte Vecchio doté de 16 tuiles de calcul disposées en deux bandes au centre de la puce – Bridge Rialto exploite huit tuiles avec 20 unités Xe chacune. Les tuiles Rambo Cache de Ponte Vecchio ont également été supprimées, bien qu'on trouve encore huit tuiles HBM et deux tuiles Xe Link. Pour la consommation d'énergie maximale de son prochain accélérateur, Intel annonce 800 watts, contre 600 watts pour Ponte Vecchio, toujours avec un facteur de forme Open Accelerator Module (OAM). Le fondeur compte toutefois passer à la prochaine spécification OAM 2.0, bien qu'il continue également à proposer ses GPU dans d'autres facteurs de forme. Pour dissiper ce surplus de chaleur, le fondeur mise sur le refroidissement liquide et même l’immersion, malgré les réticences de nombreux DSI pour cette dernière.
Intel a revu l'organisation des tuiles de son GPU Rialto Bridge. (Crédit Intel)
Sur une slide, Intel indique également que la bande passante et les entrée/sortie de ses accélérateurs Rialto Bridge est en hausse sans toutefois livrer de chiffre précis. L’exploitation de l’interface PCIe 5.0 avec l'interconnexion Xe Link et – peut-être - de mémoire HBM3 comme sur l’accélérateur Ampere de Nvidia ne sont pas étrangers à cette affirmation. Selon la feuille de route d'Intel, les premiers exemplaires – pour échantillonnage – des Rialto Bridge sont attendus mi-2023.
Les GPU Rialto Bridge sont livrés dans le même packaging que les Ponte Vecchio. (Crédit Intel)
Architecture désagrégée
L’autre grande annonce d’Intel à l’ISC est bien sûr Falcon Shores, attendu en 2024, qui annonce l’arrivée de puces désagrégées avec des tuiles hautes performances séparées pour les cœurs x86 et les noyaux GPU. Afin de créer selon les besoins des composants des CPU, des GPU ou un mixte des deux pour répondre à des charges de travail spécifiques, notamment dans les environnements AI/ML. Ces tuiles seront fabriquées avec un procédé de type Angstrom, sans plus d’indications. L’objectif final chez Intel est de multiplier par 5 les performances par watt, la densité de calcul dans un socket x86, la capacité mémoire et la bande passante par rapport aux puces serveur existantes. Pour faciliter le travail des développeurs, Falcon Shores bénéficiera d’un modèle de programmation simplifié qui, selon Intel, créera une expérience de programmation « de type CPU », vraisemblablement basée sur le portefeuille OneAPI du fournisseur.
La plateforme Falcon Shores met l'accent sur le CPU (x86), le GPU (Xe) ou une combinaison des deux architectures. (Crédit Intel)