Identifier les clients sur le point de vous quitter (les churners, en jargon) avant qu'ils ne passent à la concurrence. C'est une des applications récemment développées par la direction performance et data de SNCF Connect & Tech, une entité créée il y a quelques années et directement rattachée à la direction générale du e-commerçant.

Centrée sur l'analyse de la performance commerciale, la connaissance des clients, la gouvernance de la donnée et la réalisation de projets, cette direction exploite trois grands types d'outils pour attaquer les données stockées dans AWS S3 : Starburst (pour les analystes data), Qlik (pour la Dataviz) et Dataiku (pour la Data Science). En service depuis 2022, le studio de l'éditeur français est actuellement utilisé par une vingtaine de Data Scientists, un ingénieur data, auquel s'ajoute un profil tourné vers l'exploitation.

Un modèle décliné par segment RFM

C'est sur cet outil que SNCF Connect & Tech a développé son score de churn, avec l'objectif de détecter préventivement les clients s'apprêtant à se détourner de ses services. Selon Anaïs Rémy, responsable projets & outils au sein de la direction performances et data, qui s'exprimait lors du Every day AI summit de Dataiku à Paris, le 26 septembre, la modélisation, reposant sur de multiples paramètres, s'est appuyée sur les données des 12 derniers mois, « pour ensuite estimer le risque pour les 12 mois qui viennent ». Le modèle a été décliné pour les différents segments RFM (analyse des comportements d'achat selon les variables de récence, fréquence et montant des achats) de clients. Avec, évidemment, de meilleurs résultats sur le segment des grands clients où la filiale de la SNCF dispose de nombreuses données. La détection des clients tentés par la concurrence n'en reste pas moins complexe. Par exemple, comme l'explique Anaïs Rémy, ceux-ci continuent souvent à naviguer sur le site du e-commerçant alors même qu'ils sont en train de passer à la concurrence.

« Cette modélisation vise à identifier les variables précurseurs du churn », résume la responsable. « Mais aussi à évaluer la fenêtre temporelle pendant laquelle il est possible d'agir [pour rattraper un client sur le départ, NDLR ». Une complexité supplémentaire car cette fenêtre, nécessairement courte, suppose de mettre les données régulièrement à disposition du marketing, donc de déployer une forme d'automatisation dans le processus. Sans oublier de monitorer les résultats, pour détecter les dérives du modèle.

Les intégrations d'une plateforme de Data Science

Charge ensuite aux équipes marketing de déployer des campagnes de communication (avec des dispositifs de type A/B testing pour évaluer la pertinence des messages), des enquêtes pour comprendre les motivations des clients ou des opérations de rappels directs des clients, « de façon ciblée et ponctuelle », rassure Selon Anaïs Rémy.

Dans ce projet, l'utilisation de la plateforme de Dataiku a servi d'accélérateur, permettant de développer une première preuve de concept en un mois, « grâce aux nombreuses intégrations présentes dans la plateforme », indique la responsable. Suite à de premiers tests, une première version de production a ensuite été développée en trois mois. Au cours de ces itérations, « le besoin d'automatisation est apparu assez vite, souligne Anaïs Rémy. Nous l'avons mis en place en un mois, alors que c'est souvent fastidieux ». Aujourd'hui, ces cycles automatiques de détections des churners sont encore en cours de déploiement, SNCF Connect & Tech ayant misé, dans un premier temps, sur des opérations plus ponctuelles.