A l’occasion de son évènement I/O, Google a multiplié les annonces autour de l’IA et une se focalise sur la prochaine génération des processeurs maison, les TPU (Tensor Processing Unit). La sixième génération répond au nom de Trillium et sera lancée dans le courant de l’année au sein de l'infrastructure de Google Cloud. Sundar Pichai, CEO d’Alphabet, a indiqué lors de la conférence de presse, « nous sommes les pionniers dans les GPU depuis plus de dix ans ». Une manière de dire qu’il y a des alternatives à la dominance de Nvidia sur le marché des accélérateur IA à base de GPU.
Selon le dirigeant, Trillium va offrir une performance de calcul multipliée par 4,7 par rapport à la cinquième génération de TPU (TPU v5e et non la récente v5p). Pour parvenir à ce résultat, Google a augmenté les MXU (Matrix Multiply Unit) en relevant la vitesse d’horloge globale sans toutefois donner de chiffres. Le fournisseur a par ailleurs doublé la bande passante de la mémoire en passant à 1,638 To/s. Mais ce qui est peut-être le plus important, c’est que Trillium intègre la troisième génération de SparseCore, décrit comme « un accélérateur spécialisé dans le traitement des embeddings volumineux contenus dans les workload de classement et de recommandation avancés ». Selon la firme, les TPU Trillium pourront entraîner les modèles plus rapidement avec une faible latence et à un moindre coût.
Des économies d'énergie recherchées
Google entend aussi contrôler et maîtriser la consommation énergétique des TPU. Un élément essentiel face à la demande croissante comme le souligne Sundar Pichai, « la demande de l'industrie en matière de calcul ML a été multipliée par un million au cours des six dernières années, soit environ dix fois plus chaque année ». Google promet que les prochains TPU sont 67 % plus économes en énergie que les puces de cinquième génération. Il faudra attendre le lancement officiel pour en savoir un peu plus sur les caractéristiques techniques et les consommations énergétiques réelles. Google Cloud en profitera aussi pour lancer des instances avec sa puce ARM Axion.