Perdue Farms est en pleine transformation de son SI. Pouvez-vous nous en parler ?
Mark Booth. Effectivement, nous procédons à une transformation technologique, mais aussi à une transformation de nos processus pour soutenir notre stratégie de croissance. Nous avons remplacé nos anciens systèmes, dont certains avaient plus de 20 ans, et cela se passe très bien. Mais le plus difficile, c'est de rendre nos processus opérationnels aussi efficaces que possible pour collecter des données propres et justes, et devenir une entreprise data driven.
Outre la modification des processus d'entreprise, quels sont les autres obstacles à l'exploitation des données ?
Un défi important pour une entreprise de volaille et d'agroalimentaire vieille de 103 ans comme la nôtre, c'est de s'assurer que tout le monde adhère aux nouveaux processus. Nous devons faire comprendre à tous les employés que les données nous libéreront. Avec les bonnes informations, nous comprendrons mieux ce qui est bon pour l'entreprise et ce que veulent nos consommateurs.
C'est d'autant plus important que l'ensemble de nos activités a connu des changements importants ces dernières années. Nous avons mis au point des produits innovants en matière d'alimentation, de sorte que nous ne vendons plus uniquement du poulet. Nous avons besoin des données pour comprendre quels nouveaux produits supplémentaires nous devrions produire.
Du côté de l'agro-industrie, nous nous approvisionnons en matières premières agricoles, les achetons et les transformons, et nous offrons un portefeuille diversifié de produits, notamment des céréales, de la farine de soja, des ingrédients mélangés pour l'alimentation animale et des huiles de qualité supérieure pour l'industrie alimentaire, afin d'ajouter de la valeur aux matières premières demandées par nos clients. Les données peuvent également nous aider à enrichir nos produits de base.
Comment alimentez-vous votre datalake ?
Nous avons décidé d'adopter une approche pratique, sous la direction de Kyle Benning, qui dirige notre activité data. Les DSI connaissent le risque de construire un datalake en espérant simplement que les données vont tout simplement "tomber dedans" en quelque sorte, car il se peut que cela ne se produise pas, mais données ou pas, une infrastructure de datalake représente une dépense importante. Pour éviter cela, nous avons construit notre plate-forme data au cas par cas (sur la base de la technologie Snowflake, NDLR).
Nos partenaires métiers bâtissent des business cases avec nous, dans les activités alimentation ou agroalimentaire, qui sont approuvés par l'équipe de gouvernance des business units. Celle-ci s'assure que les business cases sont alignés sur les objectifs de l'entreprise. Ensuite, notre équipe analytics, au sein de la DSI, s'assure que nous construisons le datalake dans le bon ordre. Nous avons nommé cette équipe "information management", car nous voulons que les analystes soient nos partenaires métiers, et non les informaticiens.
Perdue Farms sélectionne les données associées à ses processus opérationnels, générées en particulier par ses machines, pour disposer d'analytics ciblés qui accompagneront sa croissance. (Photo : Perdue Farms DR)
Une fois le business case approuvé, nous le transformons en projet et le mettons en production en transférant uniquement les données de ce cas précis dans le datalake. Nous disposons d'une page web de métriques qui nous indiquent combien de données se trouvent dans la zone de consommation, et auxquelles on peut d'ores et déjà accéder, et combien se trouvent dans la zone "brute", un référentiel de données qui nécessitent encore des traitements avant d'être transférées dans la zone de consommation.
Comment formez-vous les responsables métiers à la data ?
Notre équipe data est un centre d'excellence. Kyle Benning, qui la dirige, dispose de "coachs" formant les équipes qui travaillent sur les business cases à la préparation des données et aux outils de datavisualisation jusqu'à ce qu'elles deviennent autonomes dans la création de leurs propres tableaux de bord et algorithmes pour l'utilisateur final.
En formant ainsi les équipes métiers et en déplaçant progressivement les données traitées dans la zone de consommation du datalake, au cas par cas, nous avons progressivement vu arriver une vague de fond. En commençant modestement tout en démontrant la valeur des données, les équipes sont enthousiastes et de plus en plus de départements de l'entreprise s'engagent dans le projet. Certains cherchent même désormais à embaucher des spécialistes de l'analytics métier.
Existe-t-il néanmoins des risques à cette approche au cas par cas ?
Lorsque vous introduisez des données spécifiques à un business case, il ne s'agit que des data requises pour celui-ci, et il peut donc y avoir des lacunes. Au fur et à mesure que nous passons d'un business case à l'autre, nous devons revenir en arrière pour nous assurer que nous comblons ces manques. Nous avons ainsi déplacé dans le datalake des données de performance financière qui ne représentent pas 100 % de celles qui seront requises au final. Nous travaillons donc sur un projet visant à intégrer le reste.
Pouvez-vous nous décrire un des premiers business cases que vous avez passé dans le datalake ?
Oui, sur nos machines à désosser les poulets, par exemple. Nous voulions savoir si la ligne de désossage était optimisée. Si nous l'accélérons, aurions-nous assez de personnel en bout de chaîne pour suivre et si nous la faisons tourner plus lentement, aurions-nous trop de personnel au contraire ? Finalement, nous avons réalisé de réelles économies en transférant les données opérationnelles relatives aux machines de désossage dans le datalake, pour ajuster au mieux le fonctionnement des machines.
Quel est l'avantage d'alimenter votre datalake de manière progressive ?
Le principal avantage réside dans l'acceptation par les cadres supérieurs de la valeur que représentent les data. Ils voient les tableaux de bord qu'elles alimentent automatiquement et se rendent compte qu'ils n'utilisent plus de papier et n'ont plus non plus à attendre pour disposer des reportings dont ils ont besoin.
Existe-t-il des défis spécifiques liés à l'utilisation de données opérationnelles plutôt que de données de gestion plus traditionnelles ?
Travailler avec des données financières est moins complexe. En général, les ERP sont construits pour s'adapter à la plupart des processus. Il est assez simple pour nous de comprendre ces données et de les faire passer dans un datalake. Mais avec les données opérationnelles, nous nous posons de nouvelles questions. Quel volume de données provenant des capteurs intégrer dans le datalake ? Comment les structurer ? Quelles normes leur sont applicables ? Des data sensibles, comme nos taux d'erreur de production, doivent-elles rester dans l'usine ou être transférées dans le datalake. Ces problèmes ne sont pas faciles à résoudre, et nous n'en sommes pas encore là, car nous sommes assis sur une grande quantité de données opérationnelles.
Quels conseils donneriez-vous aux DSI qui mettent en place une nouvelle organisation autour de la data ?
Commencez petit, définissez votre écosystème, simplifiez votre pile technologique et impliquez des personnes qui ont une crédibilité dans l'entreprise. Oui, vous avez besoin de la bonne technologie pour devenir une entreprise axée sur les données, mais ce n'est que le minimum vital. Les véritables moteurs sont vos partenaires métiers et les business cases qu'ils créent. En informatique, nous rendons parfois les données trop compliquées parce que nous commençons à parler de bits et d'octets, de zéros et de uns, de clouds et de plates-formes, mais ce n'est pas la question. Utilisez vos structures de gouvernance pour choisir un business case majeur pour l'entreprise, mener le à bien, puis passez aux deux ou trois suivants. Ensuite, vous verrez l'effet boule de neige.