Avec le développement des plate-formes hybrides, il est plus que jamais nécessaire de suivre la donnée. Vérifier qu’elle est bien arrivée, ou détecter son absence, pour mettre en lumière un dysfonctionnement, en centralisant les métadonnées qui indiquent qui a créé la donnée et avec quelle application, qui va utiliser cette donnée et avec quelle autre application. Certaines métadonnées sont liées à la donnée, comme la date de dernière modification ou le nom du fichier, d’autres sont centralisées dans des entrepôts, par exemple celles qui conservent la trace des traitements subits par la donnée. Pour ces dernières qui concernent le cycle de vie de la données, on utilise des plateformes big data et des outils de traçabilité, par exemple pour Hadoop, le Cloudera navigator.
La gouvernance peut se révéler l’un des éléments les plus difficile à mettre en place dans un projet de big data. « Pas à cause de sa complexité en tant que telle, explique Stéphane Hawro, directeur conseil « schémas directeurs, stratégies et data platform analytics » chez Umanis, mais parce que la gouvernance se trouve être souvent la brique que l’on reporte à plus tard. Et lorsque l’on décide de la mettre en place après des années de pratique, cela se révèle beaucoup plus compliqué. La gouvernance est un travail à la fois méthodologique et technique. »
Le monde numérique est aussi un monde où les échanges entres industries se multiplient. « La donnée va occuper un rôle central dans ces processus d'échanges entre industries et c'est pourquoi tant d'importance lui est accordée aujourd'hui, analyse Bertrand Masson, président de Moskitos. Mais l'économie de la data reste encore largement à inventer avec une nécessité d'utiliser de nouveaux outils de stockage, de distribution et d'analyse de la donnée, dont découlent les nouvelles technologies majeures de l'intelligence artificielle. La maîtrise technologique et organisationnelle de la donnée sera donc essentielle, mais au-delà de cela, sa maîtrise éthique va et a déjà commencé à jouer un rôle crucial. »
Un SI capable de s’exécuter partout dans le monde
Au sein de l’entreprise, la multiplication des échanges entre applications oblige à la mise en place de nouvelles solutions techniques. Si l’on conserve une intégration point à point, la multiplication des liens abouti à un schéma très complexe et le système d’information devient très complexe à maintenir. « Les entreprises mondiales doivent avoir un SI capable de s’exécuter partout dans le monde, insiste Bertrand Masson. Ce n’est pas possible de la faire de point à point ». Dans cette optique, Moskitos a conçu son outil Crosscut pour déployer le système applicatif partout dans le monde et offrir une garantie de performance.
« Dans le domaine du datamanagement, il est important d’aller plus loin, insiste Philippe Décherat, directeur technique de Commvault. Nous proposons notre produit Activate qui permet d’indexer les données sauvegardées. » Cela permet de répondre à des problématiques RGPD (règlement général sur la protection des données personnelles), de statistiques, d’analyse de la donnée. L’outil va exemple pouvoir détecter qu’il y a des numéros de téléphone, de carte bancaire, d’adresse e-mail dans telle partie des données.
La gestion de la donnée aide aussi à optimiser le système de stockage. Veeam gère ainsi le cycle de vie secondaire de la donnée indépendamment du cycle de vie primaire. Les données récentes, le plus souvent sollicitées, sont généralement enregistrées sur du stockage rapide. « Nous allons pouvoir réduire la quantité de données enregistrées sur ce stockage rapide et plus coûteux » argumente Stéphane Berthaud, directeur technique de Veeam. Au bout d’un certain temps, ces données seront déplacées automatiquement vers un type de stockage plus économique.
Commentaire