Lancé en 2017, le plan France Médecine Génomique 2025 piloté par le professeur Yves Lévy, PDG de l'Inserm et président de l'Alliance pour les sciences de la vie et la santé, est porteur de grandes ambitions. La principale étant de parvenir à un séquençage très haut débit du génome afin d'identifier les facteurs génétiques déterminants dans l’apparition, le développement et la transmission des maladies. Parmi les acteurs impliqués dans ce projet pharaonique, Atos, dont les progrès en termes de puissance de calcul permettent à ses systèmes de séquencer par an 20 000 génomes aujourd'hui contre 3 000 précédemment. « Après la phase de calcul, on passe à celle de la corrélation et de l'interprétation des données cliniques qui nécessitent là plutôt du traitement massif de données et du big data, d'où la nécessité d'avoir des architectures hybrides, cloud dans une logique d'évolutivité pour monter en puissance et en simplicité d'usage », a précisé Jean-Michel Rondeau, responsable projet et développement chez Atos, dans le cadre d'une table ronde organisée sur Teratec 2019.
Parmi les principales technologies mises à contribution, les capacités de calcul haute performance (HPC) et de traitement en masse des données (big data) sont bien sûr essentielles pour y arriver. « La puissance de calcul du processeur est fondamental dans ce traitement qui rend possible le séquençage du premier génome humain », a expliqué Valère Dussaux, directeur du secteur santé et sciences de la vie pour l’Europe de l’Ouest d'Intel. « La capacité à garder et retrouver l'information en mémoire, l'utilisation intensive de mémoire vive, la capacité de stocker les données, d'échanger entre les noeuds de calcul, l'interconnexion réseau efficace, autant de choses qui permettent de nouveaux usages et de répondre aux problèmes du séquençage et de l'analyse des génomes ».
Le jumeau numérique au service de la science
En plus des capacités de traitement des processeurs, les technologies de deep learning et d'entrepôts de données tiennent également une grande place dans l'équation de la résolution du séquençage du génome humain, tout comme le cloud. « Cela amène une capacité à partager les informations et faciliter l'accès aux calculateurs », a fait remarquer de son côté Jean-Luc Assor, responsable monde HPC chez HPE. « La modélisation fidèle d'un coeur humain et son jumeau numérique permet aux médecins, aux chercheurs, de travailler sur un maillage unique et de fédérer ce modèle avec des containers Linux pour en isoler la complexité, l'utiliser sur n'importe quel cloud et le faire tourner sur n'importe quel PC ou datacenter ».
La puissance de calcul ne fait cependant pas tout. « On doit conserver et constituer une base de données qui doit être sécurisée et un des aspects importants, c'est de pouvoir générer de la connaissance car cela ne servirait à rien si on n'était pas capable de tirer de l'information des bases de données », a prévenu Jean-Charles Lafoucriere, directeur du département de calcul scientifique au CEA. Ainsi, alors que la puissance des systèmes HPC progresse de mois en mois, l'un des enjeux sera surtout d'aboutir à une exploitabilité suffisante de toute cette masse de données par les utilisateurs, et en particulier les médecins, voire le grand public. « Les moyens sont performants mais il y a des difficultés à concevoir des outils fonctionnels, utilisables par une grande gamme d'utilisateurs », poursuit Jean-Charles Lafoucriere.
Le métier de médecin augmenté à l'IA
La prochaine étape du plan France Médecine Génomique 2025 va consister à centraliser et collecter la masse de données et mettre en place les premiers services de data hub. Mais là encore, la tâche ne s'annonce pas si simple. « Il y a un projet de fédération et de référencement de toutes ces bases de données, l'inconvénient c'est qu'elles sont réparties un peu partout et que l'on a une pénurie d'experts pour extraire les diagnostics ». Un constat partagé en partie par Thierry Pellegrino, vice président et general manager HPC de Dell EMC, pour qui la technologie a un rôle particulier à jouer : « Il y a pénurie de personnel médical aux Etats-Unis qui amène à faire l'analyse des radios par des humains en offshore, en Inde ou en Chine, qui pourrait être automatisé par la technologie. C'est une main d'oeuvre bon marché qui permet une rapidité d'analyse et de libérer de la ressource plus qualifiée pour traiter les symptômes et la compréhension des maladies ».
Concernant les prochaines étapes de la médecine dopée au big data et au HPC, le séquençage technologique de l'ensemble des tumeurs, dans un délai raisonnable, pourrait constituer un défi des plus intéressants. « Le problème c'est que l'interprétation derrière ces génomes est faite pour l'oeil humain. Or, en France, on dénombre une cinquantaine de personnes capables de réaliser ces interprétations. Dans d'autres pays, c'est moins, aux Etats-Unis un peu plus, cela pose la question de voir quelle place confier à l'IA », s'interroge Valère Dussaux. « Le numérique ne va pas remplacer le médecin mais le métier pour les médecins et le personnel de soins va évoluer avec des aspects ingénierie et d'IA ».