Fort de ce constat, l’institut Curie a choisi Intel comme partenaire principal pour associer le calcul à haute performance à l’intelligence artificielle afin de passer au crible la quantité massive de variants de gènes et déceler ceux qui peuvent être ciblés par des traitements anti-cancéreux. Les variants de gènes sont alors comparés avec un génome de référence. Il s’agit d’un ensemble d’étapes mis en œuvre par les généticiens, avec d’ores et déjà une assistance très importante de l’informatique ne couvrant cependant pas, à ce jour, les dernières étapes nécessaires à la production du rendu clinique, qui sont effectuées manuellement. « Vu les quantités massives de données, il est su que cette méthode basée sur l’œil humain uniquement ne permettra pas le passage à l’échelle » commente Valère Dussaux, Directeur Secteur Santé chez Intel France. « La seule manière de passer au paradigme de la médecine de précision est de s’appuyer sur l’Intelligence Artificielle pour qu’elle assiste les généticiens à interpréter les données génomiques sur les cas les simples et leur permettre de passer plus de temps sur les cas les plus complexes ». Depuis le lancement de cette collaboration, le contexte national a vu le plan France médecine génomique 2025 livrer ses premières plateformes de séquençage, en particulier la plateforme SEQOIA (Sequencing, Omics, Information Analysis) en Ile-de-France dont l’objectif est de séquencer 18 000 équivalents génomes complets par an d’ici 2022. Intel apporte à la fois son expertise pour concevoir l’infrastructure informatique et l’intelligence artificielle de haute performance, tout en fournissant l’ensemble de l’écosystème, la formation et l’accompagnement des chercheurs. A terme, cette collaboration permettra à l’institut Curie « d’améliorer la précision des diagnostics et d’obtenir dans un avenir proche un retour prédictif dans un temps raisonnable afin d’en tirer des conclusions thérapeutiques, comme pour un résultat de radiologie ou de biologie » précise Valère Dussaux. « Mais il ne s’agit que des bénéfices à l’échelle du patient. A très grande échelle, la démarche permettra de dégager des modèles standards ».

Sur un plan technique, l’infrastructure informatique fournie par Intel repose sur la génération Skylake des processeurs Intel® Xeon® Gold, des disques SSD Intel hautes performances avec des accès en lecture écriture très rapide et des adaptateurs d'interface Intel® Omni-Path pour interconnecter l’ensemble des serveurs. « L’intelligence artificielle peut parfaitement être déployée sur des architectures à base de processeurs Intel® Xeon® Gold ou Platinum» souligne Valère Dussaux. « Il n’est pas forcément nécessaire d’avoir recours à des accélérateurs de type GPU. Contrairement aux idées reçues, les processeurs Intel® Xeon® sont plus performants que les accélérateurs de type GPU pour de nombreux traitements d’intelligence artificielle dans de nombreux cas d’usage, et en particulier dans le secteur de la Santé. Et à ce titre, la toute dernière génération de processeurs Intel® Xeon® Cascade Lake lancée en mai dernier en France apporte de nombreux avantages.»

« En se rapprochant de l’IA, les usages du HPC se sont diversifiés »

À l’origine d’une autre initiative en faveur de la convergence HPC/IA, (Grand équipement national de calcul intensif) s’est récemment équipé d’un supercalculateur convergé faisant suite au rapport de Cédric Villani dans le cadre de l’initiative « AI for Humanity[1] » pour faire de la France un pays leader de l’intelligence artificielle. Ce nouveau supercalculateur, dénommé « Jean-Zay », est déployé à l'IDRIS (CNRS). Il est équipé notamment, de la dernière génération de processeurs Intel® Xeon® « Cascade Lake ». Ces processeurs supportent le nouveau jeu d’instructions VNNI (Vector Neural Network Instructions) développé spécifiquement pour accélérer certains cas d’usages en « machine learning » et Intelligence Artificielle.

Société civile fédérant tous les acteurs du calcul scientifique en France, GENCI veut capitaliser sur l’ensemble des connaissances et usages accumulés dans le calcul scientifique pour faire de l’Intelligence Artificielle à grande échelle, un vecteur stratégique d’innovation et de compétitivité pour notre économie.

Parmi tous les exemples que l’on peut citer, Pl@ntNet[2] est un remarquable projet de collaboration impliquant GENCI. En explorant de gros volumes de données, ce projet permet au travers d’une application[3] d’identifier une plante à partir d’une photo prise par l’utilisateur à l’aide de son smartphone. À l’origine, il s’agit d’un projet de recherche et de sciences participatives, soutenu initialement par Agropolis Fondation, et développé depuis 2009 dans le cadre d’un consortium regroupant le Cirad, l’INRA, l’Inria, et l’IRD, en collaboration avec le réseau Tela Botanica. Ce projet se poursuit aujourd’hui au travers de l’initiative Floris’Tic financée par le Programme d’Investissement d’Avenir. La première version de 2013 recensait 20 000 espèces. « En exploitant l’Intelligence Artificielle de manière classique, on se restreignait à des quantités limitées de mémoire, ce qui se traduisait par de petits modèles et de faibles quantités de données à explorer » explique Ludovic Saugé, HPC Industry Technical Specialist chez Intel.  « Aujourd’hui, le HPC nous permet de bénéficier d’un passage à l’échelle offrant de grosses puissances de calcul et d’importante capacité mémoire, capable de traiter des modèles de plus en plus complexes avec des quantités de données de plus en plus grandes. »

Dans le cadre de Pl@ntNet, le partenariat entre l’INRIA (Pl@ntNet), GENCI et ses partenaires, CINES et CEA ainsi que SURFsara au Pays Bas, et Intel, a permis de relever le défi d’entrainer le modèle pour couvrir 300 000 classes d’espèces en mettant à profit cette convergence HPC/IA sur les supercalculateurs de deux grands centres nationaux français hébergés au TGCC (CEA) et au CINES (représentant les Universités).

« Le HPC a véritablement changé » conclut Ludovic Saugé « Auparavant, il était principalement dédié à la simulation et la modélisation. Aujourd’hui, il est indispensable pour fournir plus de capacité de calcul à l’Intelligence Artificielle. L’infrastructure est dite convergée ; elle reste la même dans les deux cas, avec des usages qui se sont diversifiés. » Dans cet écosystème, Intel se positionne notamment comme facilitateur. « Les scientifiques qui exploitaient de l’Intelligence Artificielle n’étaient pas habitués aux mêmes outils ni aux mêmes langages que ceux qui travaillaient avec du HPC traditionnel. Notre mission est de rapprocher ces deux mondes et de créer un cercle vertueux en fournissant un écosystème complet et performant, aussi bien matériel que logiciel, et d’abstraire la complexité de l’usage des technologies. Cette nouvelle puissance de calcul disponible va sans nul doute ouvrir de nouvelles perspectives aux utilisateurs de l’Intelligence Artificielle.» Et de conclure, « Nous n’en sommes qu’au début. De nouveaux usages vont se développer. Les algorithmes d’Intelligence Artificielle vont s’inviter aussi de plus en plus dans les flots de traitement traditionnel de simulation et de modélisation. »

[1] https://www.aiforhumanity.fr/
[2] https://plantnet.org/
[3] https://identify.plantnet.org/