Avec les accélérateurs MI300X, AMD se mesure à Nvidia

Les deniers accélérateurs Instinct MI300X d'AMD répondent aux besoins de traitements d'IA générative mais aussi HPC en environnement datacenter. Des APU MI300A ainsi qu'une pile logicielle ROCm 6 apportant des fonctions optimisées pour supporter des grands modèles de langage incluant GPT-4 d'OpenAI et Gemini de Google ont aussi été présentés.

AMD avance encore ses pions sur le marché des accélérateurs. Et plus spécifiquement ceux dédiés au traitement des lourdes charges de travail d'intelligence artificielle générative - et également HPC - dans les datacenters. La société fabless spécialisée dans le design de semi-conducteurs a ainsi levé le voile sur ses accélérateurs Instinct MI300X à l'occasion d'un événement spécial « Advancing AI » retransmis sur le web. « Chez AMD nous considérons l'IA comme la technologie la plus transformatrice de ces 50 dernières années », a expliqué Lisa Su, CEO d'AMD. « L'IA la priorité numéro 1 absolue d'AMD ».

Les accélérateurs Instinct MI300X du groupe se démarquent par une bande passante mémoire optimisée (5,3 To/s théorique) pour les tâches d'entraînement et d'inférence. Ils sont conçus sur un moteur graphique CDNA 3 apportant de hauts niveaux de performances et d'efficacité pour optimiser les workloads d'IA en supportant les formats TF32, FP16, BF16 et les plus efficients INT8 et FP8. « Les unités de calcul AMD CDNA 3 prennent en charge les deux variantes du type de données FP8 telles que définies dans la spécification de la virgule flottante 8 bits de l'OCP - l'une avec une mantisse de 2 bits et un expanseur de 5 bits - et l'autre avec une mantisse de 5 bits pour l'entraînement (E5M2) et une mantisse de 3 bits avec un exposant de 4 bits pour l'inférence (E4M3) », explique AMD dans un dernier livre blanc. « Pour les calculs à précision réduite utilisés dans l'apprentissage automatique, le GPU discret MI300X apporte des gains de performance significatifs avec un débit maximal de 3,4 à 6,8 fois supérieur et des performances FP8 théoriques maximales de 2,6 PFLOP/s ».

La dernière génération d'APU Instinct MI300A de sortie

L'architecture CDNA 3 est également au coeur des APU (accelerated processing unit) Instinct MI300A présentés aux côtés des accélérateurs MI300X. La dernière génération d'unité de traitement accéléré d'AMD combine CPU et GPU avec une mémoire partagée pour permettre une efficacité, une flexibilité et une programmation accrues selon le fournisseur. « Elles sont conçues pour accélérer la convergence de l'IA et du HPC, contribuant ainsi à faire avancer la recherche et à propulser de nouvelles découvertes », avance le fournisseur.

Pour soutenir l'adoption de ces derniers accélérateurs MI300X, AMD a aussi mis en avant lors de son événement plusieurs partenaires. C'est le cas de Microsoft qui a indiqué les avoir déployés dans ses dernières instances cloud de machines virtuelles Azure ND MI300x V5 optimisées pour les workloads d'IA, ou encore Oracle qui compte bien les déployer dans certaines de ses solutions de serveurs bare-metal. Même son de cloche du côté de Meta qui va ajouter plusieurs milliers d'accélérateurs MI300X dans ses datacenters mais également recourir à ROCm 6 qui apporte des fonctions optimisées pour les LLM. Fonctionnant de pair avec les puces AMD, cette pile logicielle supporte de nouveaux types de données et apporte toutes sortes d'optimisation (noyau, librairies, algorithmes...). Meta a ainsi expliqué qu'il était capable de fournir une performance huit fois supérieure en termes de latence globale des tâches de génération de texte basées sur son LLM Llama 2 par rapport à ROCm 5 reposant sur des GPU plus anciens.

Les Ryzen 8040 dévoilés

AMD n'a pas seulement présenté ses dernières avancées technologiques pour entreprises. Le grand public a aussi été servi avec l'annonce de la dernière série de puces pour PC portables Ryzen 8040. Proposée dans plusieurs configurations de constructeurs OEM (Acer, Asus, Dell, HP, Lenovo et Razer) dans le courant du premier trimestre 2024, cette dernière génération de CPU se distingue en 9 modèles dont l'entrée de gamme Ryzen 3 8440U doté de 4 coeurs/8 threads, cadencé à 3 Ghz (4,7 Ghz en turbo), doté de 12 Mo de cache, d'une enveloppe thermique de 28 W et sans unité de traitement neuronal (NPU). En haut du panier on trouve le Ryzen 9 8945HS aux caractéristiques naturellement plus élevées : 8 coeurs/16 threads, fréquence de 4 Ghz (turbo à 5,2 Ghz), 24 Mo de cache, un TDP de 45 W et la présence d'un NPU.

« Les processeurs Ryzen 8040 sont prêts à exploiter toute la gamme de l'écosystème Windows 11 pour des performances optimisées, y compris la prise en charge complète des fonctions de sécurité de Windows 11 », explique le fabless. « Certains systèmes dotés d'un processeur Ryzen 8040 peuvent également accéder à l'IA prête à l'emploi avec Window Studio Effects Pack, ce qui permet de préserver la confidentialité à la maison ou en déplacement grâce au flou de l'arrière-plan, au suivi du regard et à l'annulation du bruit ».