D’après les dernières prévisions de Gartner, le chiffre d'affaires mondial des semi-conducteurs pour l’IA devrait atteindre 71 milliards de dollars cette année, soit une augmentation de 33 % par rapport à 2023. D'ici à la fin de 2025, les revenues de l'industrie des puces d'IA devraient atteindre 91,5 milliards de dollars, et, selon le rapport publié hier, ce rythme de croissance à deux chiffres du CA devrait se poursuivre au moins jusqu'en 2028. D'ici à la fin de 2026, 100 % des PC achetés par les entreprises seront des PC IA, c'est-à-dire des ordinateurs dotés d'une unité de traitement neuronal (NPU) permettant d'effectuer des opérations d'IA sur la machine. Ces PC ont plus d’autonomie, sont plus silencieux, chauffent moins, et ils peuvent exécuter des tâches d'IA continuellement en arrière-plan, ce qui, selon Gartner, ouvre de nouveaux champs d’usage de l'IA dans les activités quotidiennes. Le cabinet prévoit que les livraisons de PC IA atteindront 22 % du total des livraisons de PC en 2024.
Cette année, près de la moitié du chiffre d'affaires total des puces d'IA devrait provenir de la vente d'ordinateurs personnels dotés de fonctions IA. D'ici à la fin de l'année, le chiffre d'affaires des puces IA pour l’informatique devrait s'élever à 33,4 milliards de dollars, ce qui représentera 47 % du chiffre d'affaires total des semi-conducteurs IA, selon le cabinet d’études. « Aujourd'hui, l'IA générative (GenAI) alimente la demande de puces IA haute performance pour les centres de données. En 2024, la valeur des accélérateurs IA utilisés dans les serveurs, qui déchargent les microprocesseurs du traitement des données, s'élèvera à 21 milliards de dollars, et passera à 33 milliards de dollars d'ici à 2028 », a déclaré Alan Priestley, analyste vice-président chez Gartner. Cette année, le chiffre d'affaires des puces d'IA dans l'électronique automobile devrait également atteindre 7,1 milliards de dollars, et 1,8 milliard de dollars dans l'électronique grand public.
Les besoins en GPU et mémoire augmentent
Selon une étude d'IDC, 70% des entreprises du monde entier prévoient d’investir dans la GenAI au cours des 18 prochains mois, et 46 % de ces dépenses totales seront consacrées à l'infrastructure. Mais il y a un problème : la pénurie d’un élément clé nécessaire à la mise en place de cette infrastructure d'IA. Alors que les GPU sont très demandés pour faire tourner les grands modèles de langage (LLM) à la base de la GenAI, le marché a toujours besoin de puces mémoire à haute performance pour les applications d'IA. Or, pour l’instant, le marché pour ces deux composants est tendu. Les GPU utilisés pour les tâches d'apprentissage et d'inférence sur les LLM peuvent consommer de grandes quantités de cycles de processeur et être coûteux à utiliser. Les modèles plus petits, davantage axés sur l'industrie ou l'entreprise, peuvent souvent fournir de meilleurs résultats adaptés aux besoins de l'entreprise, et ils peuvent utiliser des processeurs x86 courants avec des NPU.
« Alors que la préférence pour les GPU haute performance reste de mise pour les nouvelles charges de travail d'IA, les principaux hyperscalers (AWS, Google, Meta et Microsoft) investissent tous dans le développement de leurs propres puces optimisées pour l'IA », a fait remarquer Alan Priestley. « Même si le développement de puces coûte cher, l'utilisation de puces sur mesure peut améliorer l'efficacité opérationnelle, réduire les coûts des services d'IA fournis aux utilisateurs et diminuer les coûts d'accès des utilisateurs aux nouvelles applications basées sur l'IA », a poursuivi l’analyste. « À mesure que le marché passera du développement au déploiement, nous pensons que cette tendance se poursuivra », a-t-il ajouté.
Les fournisseurs de PC adaptent leur gamme AI
Le mois dernier, le CEO d'Intel, Pat Gelsinger, a déclaré que, pour l’avenir, l'entreprise serait guidée par un concept d'IA omniprésente, avec des NPU renforçant sa nouvelle famille de processeurs Intel Core Ultra. Le fabricant de puces prévoit d'expédier 40 millions de processeurs d’intelligence artificielle pour PC en 2024 et 100 millions l'année prochaine. L'arrivée de l'IA sur les appareils périphériques est en partie due à une réduction de la durée de vie moyenne des smartphones, remplacés plus rapidement par les consommateurs et les entreprises. « Cette pratique permet aux dépenses liées aux appareils d'atteindre 688 milliards de dollars en 2024, contre 664 milliards de dollars en 2023, ce qui représente un taux de croissance de 3,6 % », indique le rapport de Gartner. « L'intégration de capacités d'IA générative dans les mobiles haut de gamme et de base soutient, plus qu'elle ne stimule, ce changement. »