Comme beaucoup d'entreprises, Rémy Cointreau appuie sa stratégie marketing et commerciale sur des études consommateurs. Une démarche chère, gourmande en temps et ressources humaines qui n'apporte pas toujours satisfaction. Depuis 5 ans, le producteur de liqueurs s'est donc tourné vers le social listening, accompagnée par Ipsos Synthesio dont la plateforme s'alimente en données « sociales » en ligne, mais aussi avec n'importe quel type de données textuelles, comme des emails clients ou des verbatims d'interviews ouvertes. Et depuis quelques mois, le groupe Rémy Cointreau a même adopté un social listening dopé à l'IA générative. Anatole Sarot, directeur tendances et Insights du groupe Rémy Cointreau, a détaillé ce projet à l'occasion du dernier salon Big Data&IA 2023.
« Mon rôle consiste à suivre les tendances de société, à comprendre les consommateurs, à aider les marques à identifier leur persona, à définir un ciblage adapté à leur ADN, a-t-il précisé. D'autant qu'en tant que producteur, nous avons finalement un accès assez rare et limité à notre client final. » Pour autant, il a témoigné de la déception partielle qu'a été le déploiement du social listening pour répondre à ses besoins. « Nous étions dans un modèle de validation et pour chacun de nos univers de de marques, nous devions définit un certain nombre de requêtes pour aller chercher des éléments précis. » Une démarche qui demandait un temps très important à la fois de paramétrage et d'analyse, pour identifier des signaux faibles dans des corpus de plusieurs millions de conversations. Qui plus est, rien ne garantissait de ne pas rater une nouvelle marque concurrente ou une tendance naissante en matière de cocktail.
Premières découvertes pertinentes avec le NLP
En 2021, pour tenter de remédier à ces problèmes, le groupe décide de se tourner cette fois vers l'IA. Il a commencé à déployer avec son partenaire des algorithmes de NLP (Natural language processing) pour travailler dans les univers qu'il avait déjà définis pour le social listening, en se basant sur le « topic modeling », méthode par apprentissage non supervisé pour extraire les sujets principaux présents dans un ensemble de documents, sous forme de groupes de mots. Objectif : regrouper les informations, d'identifier les éléments sémantiques dans les entités analysées, d'identifier des événements ou des influenceurs.
« Nous l'avons testé dans l'univers du cognac, a ainsi raconté Anatole Sarot. Nous connaissions déjà certains des résultats, bien entendu, car nous sommes normalement plutôt des experts de notre industrie ! Mais sur des éléments apparus dans les 3 ou 6 derniers mois, cela se révèle pertinent. » Pour Nicolas Baudéan, Strategic Account Manager chez Ipsos Synthesio, l'exemple du Cognac est très représentatif. « On voit apparaitre des groupes de mots autour de la boxe, de la musique, des noms de cocktails, etc. » Les résultats apparaissent sous la forme de bulles de mots sur lesquelles l'utilisateur a la possibilité de cliquer afin de naviguer dans les documents, les verbatims sources.
Goûter à l'IA générative
Après cette première expérimentation, le groupe de spiritueux a sauté le pas de l'IA générative appliquée au social learning, depuis plusieurs mois, pour répondre à des questions business plus complexes, en quelques clics et quelques secondes. Le principe est celui de prompts consolidés par use case de différents types, comme les nanotendances, la force de la marque, les motivations des consommateurs ou encore les critères ESG. Sept groupes de requêtes sur une trentaine prévus sont déjà disponibles.
« Nous avons par exemple voulu comprendre les attentes non satisfaites des consommateurs de nos marques, qui ont toutes un lien assez fort avec l'univers de la mixologie, a précisé Anatole Sarot. On peut demander si des tendances particulières autour du cocktail, associé au gin, sont en train d'arriver en Allemagne par exemple. Pour cela, on va chercher à identifier les nouvelles saveurs consommées, les nouveaux rituels des barmen etc. pour que les marques capitalisent sur ces signaux faibles. Nous avons fait tourner cette IA exploratoire sur cette question au sein de l'univers liqueurs sur 33 millions de mentions pour identifier des insights. »
L'accès aux sources pour éviter l'effet hallucination
Le module exploratoire basé sur l'IA générative affiche les ensembles de prompts thématiques consolidés. Il collecte et sélectionne par analyse de texte les documents correspondant à la requête, avant de faire tourner GPT 4 d'OpenAI sur ce corpus de data et de générer un résultat en quelques secondes. Parmi les besoins non satisfaits en matière de cocktail, par exemple, la plate-forme a identifié les cocktails sans alcool, bons pour la santé ou personnalisables, ou encore la possibilité de réaliser des cocktails maison. La plate-forme présente un tableau de bord de la volumétrie de conversations, d'interactions, sur l'ensemble des marques du groupe dans l'univers considéré - le cocktail, par exemple. Il permet de voir comment elles évoluent dans le temps, comment elles se situent les unes par rapport aux autres, etc. Enfin, pour éviter l'effet « hallucination » de l'IA générative, il est possible d'accéder aux sources d'informations utilisées par le LLM. « Il est essentiel de pouvoir explorer les résultats du travail de l'IA générative pour les valider, insiste Anatole Sarot, et de s'assurer qu'ils reposent sur des éléments tangibles et pertinents. »
Outre l'extrême rapidité d'obtention des analyses, le directeur tendances et Insights de Rémy Cointreau voit d'autres atouts à la démarche. En particulier, la capacité pour un utilisateur qui n'est ni un codeur, ni un expert métier, un expert data de faire tourner le modèle autant qu'il le souhaite, durant des semaines et de tracer les évolutions de tendances. Nicolas Baudéan d'Ipsos Synthesio y ajoute la capacité d'allouer le temps gagné dans la réalisation de l'étude à différents niveaux de la chaîne de valeur, notamment la qualité de la donnée. « Pendant des années, le social listening a ramené beaucoup de déchets dans les conversations sociales, rappelle-t-il. Le temps gagné avec l'IA générative permet de s'assurer qu'on a un corpus de données le plus propre possible, le plus qualitatif possible. »