A l’heure où tout le monde réfléchit aux usages de l’IA générative, d’autres comme Samsung s’interroge sur l’avènement à plus ou moins long terme d’une IA générale (IAG). Dans ce cadre, la firme coréenne a construit un laboratoire spécifique sur ce sujet. Situé à la fois aux États-Unis et en Corée du Sud, le Samsung Semiconductor AGI Computing Lab qui sera dirigé par Dong Hyuk Woo, vice-président senior de Samsung, aura pour seul objectif de construire un semi-conducteur qui pourra répondre aux exigences de traitement intensif de l’IAG, selon un message publié sur LinkedIn par Kye Hyun Kyung, le CEO de Samsung Semiconductor.
Selon la définition de Samsung, l'IAG est un type d'IA dans lequel les modèles ont des capacités d'intelligence encore plus grandes, ou au moins égales, à celles des humains et apprennent par eux-mêmes sans avoir besoin d'être d'abord formés sur des données humaines. Mais ce type de technologie est beaucoup plus gourmand en ressources informatiques que les grands modèles de langage (LLM) associés à la technologie actuelle de l'IA, qui doivent être formés par des humains à partir de diverses sources de données.
Du LLM à l'IAG
« Le laboratoire de Samsung se concentrera d'abord sur le développement de puces pour les LLM, en particulier sur l'inférence de l'IA et les applications », a déclaré M. Kyung. L’idée étant de développer, plus tard, des puces plus sophistiquées pour l'IAG. « Pour développer des puces qui auront besoin de beaucoup moins de puissance pour faire fonctionner les LLM, nous devons repenser chaque aspect de l'architecture de la puce, y compris la conception de la mémoire, l'optimisation des modèles légers, l'interconnexion à grande vitesse, le packaging avancé, et plus encore », a expliqué le dirigeant dans le billet.
« À terme, Samsung prévoit de publier en permanence des versions successives de ses designs de puces IAG à partir d’un modèle itératif qui offrira des performances accrues et pourra prendre en charge des modèles de plus en plus grands pour une fraction de la puissance et du coût », a-t-il ajouté. « Grâce à la création de l’IAG Computing Lab, nous serons mieux placés pour résoudre les défis complexes inhérents à l'IAG au niveau du système, tout en proposant des méthodes abordables et durables pour la future génération de modèles avancés d'IA/ML », a affirmé M. Kyung.
Un potentiel de marché inexploité
« Il semble que la création de ce laboratoire a pour objectif, du moins en partie, de fournir à Samsung des sources de revenus complémentaires sur un marché encore inexploité, car son activité principale, la mémoire, est devenue un produit de base », fait remarquer Gaurav Gupta, vice-président analyste, tendances et technologies émergentes, chez Gartner. « L’entreprise cherche une autre opportunité de croissance », a-t-il ajouté. C'est là que les puces d'inférence entrent en jeu. En effet, la plupart des entreprises qui fabriquent actuellement des composants pour le traitement et la mémoire des ordinateurs tentent de suivre l'évolution rapide de l'IA dans le cadre de diverses stratégies individuelles visant à fournir des ressources informatiques rentables.
« Actuellement, le marché des puces d'IA générative pour les modèles d'apprentissage est largement dominé par Nvidia, avec une certaine part pour AMD », a expliqué le consultant. Mais ces modèles fonctionnent sur des accélérateurs GPU, parfois rares et coûteux, qui n’offrent donc pas une solution à long terme pour l'exécution de modèles d'IA. « Les entreprises recherchent des ressources alternatives pour faire fonctionner l'IA basée sur l'inférence, et Samsung espère être l'un des premiers à proposer des semi-conducteurs pour cette technologie », a encore déclaré M. Gupta. « Lorsqu'il s'agira de déployer l'IA à la périphérie ou sur des terminaux, il est probable que l'inférence sera effectuée sur des puces personnalisées spécifiquement conçues pour exécuter des modèles finement réglés », a-t-il dit. C'est justement ce que Samsung prévoit de faire en se lançant dans la conception de ce type de composants et en pénétrant ce marché, qui n'a pas encore vraiment décollé.
Commentaire