Bayer Crop Science considère l'IA générative comme un catalyseur permettant à des milliers de ses scientifiques et ingénieurs data de bâtir des solutions agricoles innovantes pour les agriculteurs du monde entier. Pour concrétiser ses ambitions, la division agricole de la multinationale des sciences de la vie Bayer, entité qui pèse environ un tiers du chiffre d'affaires du groupe allemand (soit 5 Md€), est en train de développer une nouvelle plateforme de Data Science basée sur Amazon SageMaker Studio, explique Will McQueen, responsable des actifs data de Crop Science chez Bayer. Dotée des capacités d'IA d'Amazon Bedrock et d'Amazon Q, la plateforme a été conçue pour faciliter et accélérer la création de produits agricoles « inédits », selon le responsable.

Une équipe d'une dizaine d'ingénieurs et de cadres de Bayer, d'Amazon et du cabinet de conseil Slalom Consulting a élaboré l'architecture de la plateforme Decision Science Ecosystem il y a environ 18 mois et la construit depuis près d'un an. Les Data Scientists de Bayer ont développé plusieurs prototypes de modèles d'IA générative sur la nouvelle plateforme, cette dernière restant pour l'instant en phase de découverte et d'évaluation de son « efficacité », selon Will McQueen, ajoutant que les modèles ne seront pas mis en production avant 2025.

« Le pipeline de R&D est très confidentiel à ce stade », précise le responsable. L'idée centrale est que l'IA générative avancée pourrait un jour conduire à la création de semences hybrides ou de nouvelles semences susceptibles de modifier et d'enrichir la chaîne d'approvisionnement alimentaire. « Le coeur de la mission de notre entreprise est de nourrir le monde », rappelle Will McQueen.

Automatiser l'écriture de la documentation

La plateforme de Data Science existante de Bayer Crop Science, construite sur une technologie propriétaire baptisée Domino il y a environ 7 ans, est à bout de souffle et doit être remplacée pour faciliter l'entrée de l'entreprise dans l'ère de l'IA, reprend le responsable data. La première version majeure de Decision Science Ecosystem est attendue dans les deux prochains mois.

Comme la plupart des entreprises, la division agricole de Bayer utilisera initialement des outils d'IA générative basés sur AWS pour automatiser ses processus métier de base, tels que la production de documentation technique interne, souligne Will McQueen. Le noyau d'ingénieurs qui construit la plateforme a d'ailleurs exploité cette fonctionnalité pour accélérer le processus de développement lui-même.

« Avant la mise à disposition de ce type d'outils, les ingénieurs devaient créer leur propre documentation à partir du code qu'ils écrivaient et d'autres développements. Les fonctionnalités prêtes à l'emploi d'AWS remplacent ce travail manuel, ce qui rend notre personnel d'ingénierie plus efficace et capable d'apporter de la valeur beaucoup plus rapidement qu'auparavant », souligne Will McQueen. A terme, le responsable data espère que la mise à disposition de ces outils dans l'ensemble de la division favorisera l'expérimentation et l'innovation.

Un registre pour les modèles

La future plateforme de Data Science, qui sera utilisée par les ingénieurs et les Data Scientists de Bayer, comprend également des connexions et des intégrations avec Amazon Bedrock, la possibilité d'écrire du code en utilisant le langage naturel, ainsi que des tests et des contrôles de sécurité.

L'équipe Crop Science a également développé des fonctionnalités spécifiques. Notamment son registre des modèles, un catalogue personnalisé de modèles d'IA et de fonctionnalités de gestion du cycle de vie des modèles, qui associent des exigences à chaque étape depuis le développement jusqu' à la mise en production, en passant par les tests et le déploiement. « Au fur et à mesure que le modèle évolue dans son cycle de vie, il doit passer par différentes portes et respecter différentes exigences, afin de valider chaque étape de son développement », précise Will Mc Queen. Le registre des modèles permet également aux Data Scientists de réexploiter le code développé par leurs collègues. « En termes d'accélération de l'innovation, nous misons sur la réutilisation pour créer des opportunités via l'IA générative et Bedrock », souligne le responsable.

Initier le changement

La plateforme développée par la division agricole de Bayer peut non seulement faciliter le développement de modèles, mais aussi aider à former les Data Scientists et les ingénieurs aux techniques d'ingénierie de prompt et à l'utilisation de technologies data avancées au service de la création de nouvelles offres. Lors de son récent sommet, AWS a d'ailleurs cité Bayer Crop Science parmi ses clients les plus innovants en matière d'IA générative, aux côtés de la plateforme avancée de découverte de médicaments d'Exscientia et de l'ESM3 d'EvolutionaryScale, qui offre aux scientifiques et aux biologistes une plateforme d'ingénierie de prompt pour la construction de diverses protéines à des fins d'expérimentation.

Si l'innovation fait partie de l'ADN des scientifiques et ingénieurs de Bayer Crop Science, le niveau de gestion du changement qu'implique l'utilisation des plateformes de GenAI - même pour des personnes hautement qualifiées - est complexe et nécessite une « évaluation réfléchie », souligne Will McQueen. « Il faut un peu de temps pour s'habituer à faire son travail de manière fondamentalement différente en tirant parti de l'IA ».


La division agriculture de Bayer voit la Data Science et l'IA comme un nouvelle arme dans l'arsenal des chercheurs développant des solutions pour l'agriculture. (Photo : Bayer AG)

Les fonctions de base de la GenAI, telles que la synthèse de documents et la création de contenu, améliorent déjà la qualité de la plateforme de Data Science offerte aux utilisateurs et réduisent le temps de mise à disposition des applications, selon le responsable. Mais, au fil du temps, celui-ci espère que les porteurs de projets innovants et les scientifiques de Bayer deviendront plus habiles à intégrer les outils et les capacités de la plateforme pour innover de manière différente. « Ce qui va accélérer l'intégration des employés à [notre] plateforme de GenAI et permettre une meilleure compréhension des capacités de celle-ci à bâtir des modèles. Il s'agit d'un processus additif », assure le responsable data.

Toutefois, ce fonctionnement nécessitera une supervision et de solides procédures de contrôle qualité, ajoute Will Mc Queen, reconnaissant les risques associés à l'expérimentation d'outils scientifiques avancés. À cette fin, l'équipe de division Crop Science a mis en place des mesures pour éviter que des données propriétaires ne sortent de la plateforme ou, pire, que des solutions prometteuses mais insuffisamment testées ne soient déployées auprès des clients de Bayer Crop Science un peu partout dans le monde.

Plateforme ouverte sur les LLM Open Source

Pour ses infrastructures, Bayer Crop Science exploite un environnement multicloud, mais Will McQueen a opté pour un partenariat plus étroit avec AWS sur l'IA générative en raison de sa plateforme qu'il juge plus flexible et plus ouverte. La plateforme basée sur Bedrock permettra aux scientifiques et ingénieurs data de Bayer d'accéder à une grande variété de LLM Open Source disponibles sur des places de marché telles que Hugging Face.

La plateforme d'IA d'Amazon permet également aux entreprises d'utiliser la plateforme de données de leur choix, un aspect essentiel du développement des modèles d'IA génératives. Bayer Crop Science a, sur ce terrain, retenu Google BigQuery comme entrepôt de données. « L'une des choses que nous avons identifiées très tôt avec AWS, c'est la possibilité de construire des capacités techniques flexibles afin de développer une architecture à base de composants multiples, qui nous permette de brancher différents modèles provenant de différents fournisseurs », explique-t-il. Le catalogue de modèles d'IA générative de Bedrock, par exemple, comprend des modèles Open Source et d'autres propriétaires, tels que le Llama 2.1 de Meta et le Large 2 de Mistral, son modèle d'IA le plus avancé actuellement.

Comme l'indique Dave McCarthy, vice-président de la recherche sur les services cloud et edge au sein du cabinet d'études IDC, « les fournisseurs de cloud adoptent des approches différentes pour rendre les différents types de modèles accessibles à leurs clients. Google s'est concentré sur la valeur de sa famille de modèles Gemini développée en interne, tandis qu'AWS a adopté une approche plus axée sur les partenariats avec des fournisseurs de modèles tiers. Il n'y a aujourd'hui pas de gagnant clair quant à l'approche la plus pertinente à long terme. »

Mesures de protection intégrées

Bien qu'elle n'en soit qu'à ses débuts en la matière, Bayer Crop Science développe un certain nombre de nouveaux cas d'usage, présentés par Will Mc Queen comme disruptifs dans l'industrie agricole. Par ailleurs, la division poursuit le développement de sa plateforme de Data Science parallèlement à celui de Bedrock et prévoit d'autres lancements correspondant aux mises à jour de l'offre d'IA d'Amazon.

Au fur et à mesure qu'il s'oriente vers des cas d'usage avancés, l'équipe IT de Will McQueen a intégré des outils de filtrage et de surveillance automatisés et d'autres mesures de protection pour sécuriser les données propriétés de l'entreprise, y compris l'intégration de méthodologies qui guident les scientifiques et les ingénieurs vers un développement responsable.

« Pour toutes les nouvelles fonctionnalités que nous développons et qui sont susceptibles d'être commercialisées ou directement intégrées dans un processus, les employés doivent procéder à des analyses comparatives et à des tests minutieux avant qu'elles ne soient lancées sur le marché », explique le responsable à propos des efforts déployés par son équipe pour éviter que des prototypes ne soient introduits dans l'approvisionnement alimentaire sans un contrôle qualité rigoureux, intégré à la plateforme de Data Science elle-même.

« Nous pouvons tester les modèles et les confronter à des experts humains pour valider leur pertinence avant qu'ils n'atteignent le stade de la mise en production à grande échelle, illustre Will Mc Queen. Il est important que nous ne lancions pas une nouvelle capacité à l'extérieur, puis que nous ne donnions pas de mauvais conseils à un agriculteur, ce qui aurait un impact sur son activité et lui causerait un préjudice. »