L'effervescence autour de l'IA générative bat son plein. Cette fois c'est au tour d'un quatuor français de fournisseurs IT de rentrer dans le bain. Conçue et développée par le pôle data et IA de Docaposte dirigé par Guillaume Leboucher (fondateur d'Openvalue racheté en 2021 par la filiale de La Poste), cette solution s'appuie sur trois autres partenaires LightOn, Aleia et NumSpot. Dans le cadre de cette alliance, LightOn est chargée du développement des grands modèles de langages (LLM) couplée à une plateforme - Paradigm - pour en garantir les performances. De son côté, NumSpot - dont fait partie Docaposte mais aussi Dassault Systèmes, Bouygues Telecom et la Banque des Territoires - est chargé de l'hébergement des données dans un environnement qualifié SecNumCloud via l'infrastructure cloud d'Outscale sur laquelle il repose. Enfin, Aleia adossera à cette offre sa plateforme IA collaborative pour créer et gérer toutes sortes d'objets (données, notebook, modèles...)
En développement depuis de nombreux mois, cette offre d'IA générative - sans nom pour l'heure - a mobilisé plusieurs dizaines de personnes au sein de Docaposte qui n'en n'est pas peu fière : « c'était un projet tellement important », nous a expliqué Guillaume Leboucher. « Nous sommes ravis des résultats et nous savons qu'on le rentabilisera ». A ce jour, plusieurs clients dans le secteur du médical recourent à la première brique d'IA générative en bêta depuis juin dernier à des fins de gestion des dossiers patients, pour synthétiser des comptes-rendus médicaux et apprendre à requêter sur des dossiers médicaux. « Quand nous parlons de santé, les utilisateurs sont encore plus précautionneux », indique Guillaume Leboucher. « Notre chatbot leur permet de gagner du temps et nous savons qu'il y aura des gains dans les traitements des résultats mais nous ne pouvons pas encore communiquer dessus ».
Pas de course aux hyper-paramètres
Si Docaposte met bien volontiers la notion d'offre souveraine pour parler de son chatbot, il n'en reste pas moins que seule la brique de stockage des données (via Outscale) de cette offre bénéficie d'une certification SecNumCloud. Ce n'est pas encore le cas des autres briques (LLM et traitement des données) et il faudra donc attendre de longs mois avant d'obtenir le précieux sésame pour l'offre complète. Concernant la capacité du LLM déployé, Docaposte annonce la couleur : « Nous n'avons pas les moyens des américains mais pour de l'informatique de gestion avec LLM, nous avons des résultats », fait savoir Guillaume Leboucher. « Nous ne voulons pas rentrer dans le match de celui qui a la plus grosse brique LLM et faire la course aux milliards de paramètres. Nous avons travaillé il y a quelques mois sur ChatGPT et nous nous sommes aperçus que nous pouvions sortir des résultats intéressants avec LightOn. Ce que nous voulons ce sont de meilleures interactions et de la sécurité pour fournir un service de base qui tourne bien ».
Docaposte prévoit une commercialisation auprès de deux types de clients : la santé d'une part mais aussi le secteur public en proposant d'abord une offre « sur étagère » et dans un deuxième temps une autre orientée prompt factory pour des projets impliquant des experts en ingénierie de requête qui « comprennent les spécificités des MLP [réseau neuronal organisé en plusieurs couches, ndlr] et des Transformers [architectures de réseaux neuronaux, ndlr] qui vont se mettre à côté des métiers et les aider à rentrer dedans », précise Guillaume Leboucher.