L'importance croissante accordée aux données et aux applications analytiques incite les organisations à accorder une plus grande attention à leurs stratégies de gouvernance de la donnée. En effet, selon une récente enquête du cabinet Gartner, 63 % des responsables de la donnée et de l'analytique affirment que leur organisation a accru ses investissements dans la gouvernance des données.
La raison ? La gouvernance des données n'est plus considérée uniquement comme un vecteur de conformité, mais comme un vecteur essentiel garantissant que des données correctes et de qualité sont accessibles aux utilisateurs finaux quand ils en ont besoin. Un facteur clé pour devenir une organisation axée sur les données.
Naga Gurram, le directeur de l'ingénierie logicielle chez Capital One, une banque américaine employant environ 50 000 personnes, est lui aussi convaincu de la valeur de la gouvernance : « à long terme, vos coûts seront moins élevés et votre vitesse d'exécution sera bien supérieure » Mais encore faut-il une stratégie de gouvernance de la donnés adaptée à l'ère numérique. Car les données en temps réel ne vous mèneront pas bien loin si des processus de gouvernance lents et complexes gomment ces efforts de collecte et de traitement.
« Comment puis-je permettre aux utilisateurs d'accéder aux données dont il a besoin, en temps réel et à grande échelle ? Si nous ne réussissons pas à fournir le bon produit au bon moment, nous ne faisons pas correctement notre travail et nous perdons l'occasion de mieux servir nos clients », explique Naga Gurram.
Les volumes font exploser l'ancien modèle
La gouvernance des données est un système qui permet de définir qui, au sein d'une organisation, a l'autorité et le contrôle sur les données et comment ces données peuvent être utilisées. Elle englobe les personnes, les processus et les technologies nécessaires à la gestion et à la protection de ces données. La plupart des entreprises disposent déjà d'une certaine forme de gouvernance des données qui s'applique à des applications prises individuellement, à des départements ou fonctions spécifiques. L'évolution de la pratique passe toutefois par la mise en place d'un contrôle systématique et formalisé des processus et des responsabilités à l'échelle de l'entreprise.
« Il est difficile, en amont, de se rendre compte à quel point cela va vous aider », reprend Naga Gurram, qui ajoute que Capital One a fait évoluer sa pratique de gouvernance à partir de son ancien modèle centralisé afin de mieux répondre à un paysage de données en évolution rapide. « Dans notre ancien monde, nous disposions d'un ensemble fini d'infrastructures, d'un ensemble fini de données et d'un ensemble fini d'utilisateurs. Nous avions alors l'habitude de gérer la gouvernance des données de manière centralisée », détaille le directeur de l'ingénierie logicielle de la banque.
Dans cette approche, les unités opérationnelles s'adressaient à l'équipe centrale pour tous leurs besoins en matière de gouvernance des données. L'équipe veillait à ce que toutes les données soient soumises aux politiques de gouvernance adéquates et à ce que les unités opérationnelles respectent bien toutes ces politiques. « Mais nous avons assisté à une explosion des données », constate Naga Gurram. « Nous avions l'habitude de parler de téraoctets de données ou de centaines de téraoctets de données. Aujourd'hui, nous parlons de centaines de pétaoctets de données. Les données proviennent de partout ! »
La gouvernance roule à l'hybride
Pour faire face à cette explosion, Capital One a mis en place une pratique hybride de gouvernance des données, avec une équipe centrale et des équipes fédérées intégrées dans ses lignes d'activité. L'équipe centrale se concentre sur la création de plates-formes de gouvernance des données et d'outils en libre-service utilisés par les lignes d'activité. Elle est également chargée de maintenir la vision de l'entreprise en matière de gouvernance des données et de promouvoir un changement culturel visant à faire que les données soient traitées comme un produit à part entière.
« Toutes nos politiques, toutes nos plateformes, tous nos outils sont gérés par une équipe centrale et construits par une équipe centrale, mais l'exécution de la gouvernance des données est assurée par des équipes fédérées », résume le dirigeant IT. « Nous donnons les bons outils et la plateforme à nos partenaires des métiers, à nos lignes d'activité, et ils s'assurent d'obtenir les données. Ils publient ces données sur la base de ces politiques à l'aide d'un outil en libre-service ». Avec les bons outils et les bonnes plateformes en place, les équipes de gouvernance des données au sein des métiers peuvent se concentrer sur la fourniture de services et politiques adaptés aux cas d'utilisation et aux données spécifiques à leurs secteurs d'activité.
Le piège des frais généraux
Mais la refonte de la stratégie ne s'arrête pas là, puisque Capital One adopte ce qu'elle appelle une approche de « gouvernance progressive », avec différents niveaux de gouvernance et de contrôle des l'accès et de la sécurité en fonction de la nature des données. « Vous devez donner de la flexibilité à vos équipes partenaires afin qu'elles puissent appliquer les politiques dont elles ont besoin au nom des lignes d'activité dont elles dépendent, explique Naga Gurram. « Il ne faut pas avoir un seul ensemble de règles pour tout le monde. Ce n'est pas comme si un ensemble de règles était applicable à chaque jeu de données ».
Essayer d'imposer une politique unique à toutes les données de votre organisation est l'une des façons les sûres d'amener la gouvernance des données à être ranger dans la case des frais généraux. Une image qui colle à cette pratique. Pourtant, pour Naga Gurram, lorsqu'elle est correctement planifiée et mise en oeuvre, ses bénéfices dépassent largement les coûts qu'elle engendre. « Ce que je recommande à tous ceux qui s'engagent dans cette voie, c'est de ne pas considérer la gouvernance comme des frais généraux. Ne considérez pas la pratique comme un patchwork. Ne la considérez pas comme un projet. Il faut l'envisager de manière holistique et se concentrer sur le résultat lorsque l'on veut vendre son développement en interne. »
Les avantages de la gouvernance de données comprennent une meilleure conformité aux réglementations certes, mais également :
- une meilleure aide à la décision, plus complète, grâce à des données cohérentes et uniformes dans l'ensemble de l'organisation ;
- Des règles claires pour modifier les processus et les données qui aident l'entreprise et l'informatique à devenir plus agiles et plus évolutives ;
- Une réduction des coûts dans d'autres domaines de la gestion des données grâce à la mise en place de mécanismes de contrôle centralisés ;
- une efficacité accrue grâce à la possibilité de réutiliser les processus et les données.
Gare au patchwork de règles fragmentées
Si vous travaillez à la mise en oeuvre d'un cadre de gouvernance des données pour votre organisation, Naga Gurram indique que le meilleur moyen de commencer est d'adopter une approche holistique axée sur les objectifs que vous essayez d'atteindre. N'essayez pas d'adapter vos politiques aux données dont vous disposez - cela conduirait à un patchwork de politiques fragmentées. « Ne réunissez pas un grand nombre de données, pour essayer de les comprendre et de rédiger des règles adaptées. Construisez plutôt une vision et publiez vos données sur la base de ces politiques. C'est beaucoup plus facile que de se démêler de ce patchwork ».
Naga Gurram conseille de se poser un certain nombre de questions : Disposons-nous des bonnes plateformes de données pour mettre en oeuvre la meilleure gouvernance de données ? Avons-nous les bons outils pour faciliter la tâche de nos utilisateurs ? Avons-nous les bonnes compétences pour pouvoir mettre en place ce système de manière transparente ? Chacun comprend-il son rôle et ses responsabilités ? « Si l'on réfléchit à ces questions pour élaborer une stratégie, il est facile de la mettre en oeuvre, dit le dirigeant IT de Capital One. Vous allez construire votre gouvernance avec l'objectif final en tête. En revanche, si vous ne vous concentrez pas sur le résultat, la mise en oeuvre s'annonce très difficile ».
La gouvernance des données à grande échelle vue par Capital One
Avec des centaines de pétaoctets de données en exploitation, la banque américaine a adopté un modèle hybride et un cadre de gouvernance spécifique pour s'assurer que ses lignes d'activité obtiennent bien les données dont elles ont besoin. Et en temps réel.