Créée en 2017 par Clément Delangue et Julien Chaumond, la start-up franco-américaine Hugging Face à l'origine d'un projet communautaire de bibliothèques open source en traitement du langage naturel (NLP) a de quoi se réjouir. IBM et la Nasa ont en effet annoncé la disponibilité sur la plateforme de leur modèle conjoint de fondation IA géospatial servant à analyser, prévoir et anticiper le changement climatique et adapter la vie humaine à ses conséquences. Basé sur watsonx.ai, ce modèle a été entraîné sur les données harmonisées du satellite Landsat Sentinel-2 de la Nasa (HLS) avec un paramétrage spécifique exploitant des données relatives à certains cas d'usage incluant les feux et les inondations. Cette annonce fait suite à une précédente collaboration entre IBM et la Nasa de février dernier pour accélérer l'analyse des images satellite et améliorer la découverte scientifique.
« En combinant les efforts du modèle de fondation d'IBM visant à créer des systèmes d'IA flexibles et réutilisables avec le référentiel de données satellitaires de la Nasa, et en les rendant disponibles sur la plateforme IA open source Hugging Face, nous pouvons tirer parti de la puissance de cette collaboration pour mettre en œuvre des solutions plus rapides et plus efficaces qui amélioreront notre planète », a indiqué IBM. « Grâce à des ajustements supplémentaires, le modèle de base peut être redéployé pour des tâches telles que le suivi de la déforestation, la prévision des rendements agricoles ou la détection et la surveillance des gaz à effet de serre ». Les chercheurs des deux structures travaillent également avec l'université Clark pour adapter le modèle à des applications telles que la segmentation de séries temporelles et la recherche de similitudes.
Une prédiction améliorée avec moins de données ingérées
Ce modèle conjoint a permis d'améliorer la prédiction de 15 % par rapport à ce qui se faisait jusqu'avant en ingérant moitié moins de données, a expliqué à Venture Beat Sriram Raghavan, vice président d'IBM Research. « Il s'agit maintenant de diviser par deux le travail qu'un expert en la matière doit effectuer », a expliqué Sriram Raghavan. Dans un cas d'usage relatif aux incendies, un modèle a pu être créé utilisant 75 % de données en moins que le modèle de pointe actuel avec à la clé des améliorations de performance à deux chiffres selon lui.