Alors que les processeurs AmpereOne commencent à être livrer aux constructeurs de serveurs et aux opérateurs de services cloud (Alibaba Cloud, Scaleway ou encore Supermicro), Ampere a dévoilé des détails supplémentaires sur ses derniers composants. Conçus en internes sur base ARM et fabriqués par TSMC en 5 nm, ils sont dotés de 136 à 192 coeurs, sans hyper-threading, avec support de la DDR5 et du PCIe Gen5. Pour rappel, les puces de la génération précédente (Altra Max) ne disposaient « que » de 128 coeurs (toujours sans SMT). Par ailleurs, et pour la première fois chez Ampere, les puces AmpereOne sont basées sur le set ARM ISA (Instruction Set Architecture) revu et adapté par le fournisseur, en lieu et place des coeurs ARM Neoverse de la génération précédente (Altra). Apple travaille de la même façon pour ses puces Silicon.
Parmi leurs caractéristiques figure la prise en charge de bfloat16, le jeu d'instructions utilisé dans l'inférence et l'apprentissage pour les IA. « L'inférence de l'IA est l'une des charges de travail qui nécessite de plus en plus de puissance de calcul, que ce soit dans les datacenters à grande échelle ou en Edge », explique Jeff Wittich, directeur des produits chez Ampere.
Proposées avec un peu plus de coeurs que les Alltra, les puces AmpereOne supportent surtout le PCIe Gen5 et la DDR5. L'enveloppe thermique passe toutefois à 350 W avec 192 coeurs. (Crédit Ampere)
Plus de capacités à énergie égale
Par ailleurs, la société affirme que ces puces (350 W max) sont deux à trois fois plus économes en énergie que les processeurs pour serveurs d'Intel et AMD. Un moyen, selon Jeff Wittich, de répondre aux besoins des sociétés souhaitant augmenter leur capacité de calcul, mais n'ayant accès ni à de l'énergie supplémentaire, ni à de nouveaux datacenters : « Toute capacité de calcul dans le cloud est limitée par la quantité d'énergie disponible. Nous devons donc fournir plus de capacité de calcul, sans pour autant consommer davantage ».
AmpereOne utilise un design chiplet pour diviser le CPU en plusieurs puces, plutôt que d'exploiter un seul morceau de silicium monolithique. Ces semi-conducteurs sont reliés entre eux par un maillage des coeurs qui agit comme un « agent de circulation sophistiqué », selon les termes du directeur des produits. Il optimise le trafic pour éviter les goulets d'étranglement.
Destinées aux fournisseurs de services cloud
A noter cependant, que tous ces coeurs peuvent entraîner une concurrence pour les ressources partagées telles que la mémoire ou le cache du système. AmpereOne dispose donc de fonctionnalités de gestion de la qualité de service qui limite la quantité de bande passante mémoire utilisée par un processeur spécifique. Le microcode peut également donner la priorité à un processus déterminé pour s'assurer qu'il bénéficie d'une bande passante mémoire suffisante. Enfin, à la demande de ses clients, AmpereOne prend également en charge la virtualisation imbriquée, qui permet à des instances de machines virtuelles (VM) de tourner dans d'autres VM, afin de créer son propre environnement de virtualisation.
Bien que la gamme de processeurs Ampere soit principalement destinée aux fournisseurs de services cloud, Jeff Wittich indique que ses puces peuvent également intéresser des entreprises utilisatrices pour leurs propres infrastructures exécutant en local des PaaS et des applications conteneurisées.
Commentaire