Tout juste âgée de 70 ans, l'entreprise de cosmétique française Clarins a décidé de prendre le virage data driven. Une stratégie qui vise prioritairement à faire passer à l'échelle le recrutement de clients, à transformer les consommateurs en ambassadeurs de la marque et à augmenter l'efficacité opérationnelle de l'ensemble de l'organisation. Et pour ce faire, Clarins a opté pour une architecture centrée sur un datalake Snowflake et une gouvernance data mesh impliquant directement les métiers. C'est ce qu'a détaillé Marie-Jeanne Freiha, directrice data et analytics de Clarins, à l'occasion du Snowflake World Tour à Paris, le 1er octobre.

L'entreprise veut en effet rendre la data disponible et accessible simplement pour tous ses employés, la standardiser, en augmenter la qualité et définir une gouvernance et des responsabilités clairement identifiées. Pour y arriver, Clarins a d'abord cartographié de grands domaines data comme la finance, le CRM ou la supply chain, défini les rôles et responsabilités et établi des règles de gestion pour garantir la qualité des données.

Une gouvernance data mesh

« Nous avions auparavant une équipe centralisée en charge de la dataviz qui répondait aux demandes des métiers en faisant l'interface avec les ingénieurs data », a expliqué Marie-Jeanne Freiha. « Or, le time to delivery n'était pas suffisamment performant. Nous nous orientons donc désormais une organisation data mesh multidisciplinaire par métier, avec un data ownership de bout en bout jusqu'à la dataviz. Et avec un domaine par fonction, en lien avec la cartographie de la data gouvernance ».


Marie-Jeanne Freiha, directrice data et analytics de Clarins à l'occasion du Snowflake World Tour à Paris. (Photo ED)

La gouvernance data s'appuie sur trois piliers : la qualité de la data, la constitution d'un catalogue de données et la promotion interne. « Nous n'avons pas encore de catalogue proprement dit, a précisé Marie-Jeanne Freiha, mais Snowflake gère déjà le lineage avec les metadata. Nous travaillons aussi sur une taxonomie ». L'entreprise a aussi entrepris de rationaliser et homogénéiser ses datavizs avec des normes de développement, des chartes graphiques, etc. avec Qlik et Cognos entre autres. Elle a aussi défini avec Snowflake des frameworks pour l'ingestion de données dans le datalake et pour le développement de pipelines data. La plupart de ces fonctions s'appuient sur Azure Data Lake Storage (ADLS) de Microsoft.

Un chatbot personnalisé

L'éditeur a d'ailleurs accompagné Clarins dans le déploiement de son premier cas d'usage, un chatbot clients personnalisé, basé sur ChatGPT. Le LLM a été enrichi en RAG avec la base de connaissance Clarins afin de personnaliser les réponses aux clients. Enfin, l'entreprise travaille désormais sur un core model de chatbot à partir de ce cas d'usage afin de le reproduire dans le monde entier. En pilote aux États-Unis pour l'instant, il sera déployé dans 6 autres pays, dont la France, l'an prochain.