Fondé en 2013 par deux chercheurs de l'Inria, Olivier Clatz et Pierre Fillard, Therapixel a conçu et développé une technologie pour analyser les images médicales à l'aide de l'intelligence artificielle. Pour entraîner ses algorithmes de façon plus efficace, elle a choisi en 2022 de s'appuyer sur la plateforme de stockage full flash de Vast Data, la solution Universal Storage.
En 2017, Therapixel a remporté le DREAM Digital Mammography Challenge, une compétition internationale à laquelle près de 1200 équipes de recherche participaient. Après cette victoire, l'entreprise, qui au départ avait conçu un logiciel d'imagerie médicale pour les chirurgiens en salle d'opération, a pivoté pour se spécialiser sur la détection du cancer du sein à partir d'images de mammographies et l'interprétation des résultats. Afin d'obtenir des algorithmes performants, l'entreprise doit les entraîner sur de très gros volumes de données. À titre d'exemple, lors du tournoi qui l'a lancée dans le domaine de la radiologie, les équipes disposaient de 640 000 images anonymisées à interpréter.
Rapidité d'accès aux données
Avec de telles volumétries, le stockage peut rapidement devenir un facteur limitant. « Auparavant, nous nous appuyions sur des solutions de stockage sur disque dur plus lentes, qui ne disposaient pas d'un espace de stockage suffisant pour les données nécessaires à l'entraînement des algorithmes qui résolvent le cancer du sein », explique ainsi Aurélien Chick, data manager chez Therapixel. « Or, on ne peut développer aucune solution d'IA sans un accès rapide aux données », souligne-t-il.
C'est pour répondre à ce besoin que l'entreprise s'est tournée vers la plateforme Universal Storage. Celle-ci lui a permis à la fois d'accroître les performances et de doubler sa capacité de stockage, avec également des gains en termes d'évolutivité et en simplicité d'utilisation. Désormais, Therapixel peut s'appuyer sur plus d'un million de mammographies pour entraîner et tester ses algorithmes, ce qui lui permet de détecter les cancers du sein avec un haut niveau de fiabilité dès la première lecture et avec une précision plus élevée. Le logiciel fournit également aux radiologues une vue en temps réel des caractéristiques identifiées par l'algorithme, afin d'aider ces derniers à se concentrer sur les lésions suspectes. « Nous pouvons développer des idées et les tester rapidement, puis confirmer ces idées avec davantage de données pour entraîner les algorithmes », apprécie Aurélien Chick.