Alors pourquoi les entreprises éprouvent-elles autant de difficultés à valoriser leurs données ?
« Plusieurs raisons l'expliquent : déjà, une partie des données n'est pas collectée ou n'est pas utilisable et/ou interprétable. Ensuite, les entreprises font face à un éparpillement de leurs données dans de multiples environnements, dans une usine, un magasin, un data center, le cloud, un SaaS. De même, prenons l'exemple des pièces de rechange pour le secteur de l'automobile impliquant de nombreux acteurs (du garagiste au constructeur en passant par le sous-traitant). Dans ce cas, les silos IT et l'hétérogénéité des interfaces des équipements participent à cette difficulté de la diffusion des données d'un bout à l'autre de la chaîne. Enfin, pour des raisons de coûts le plus souvent, il y a un manque de ressources et de compétences pour trier, stocker, sécuriser, analyser et valoriser les données », résume Antoine Le Bideau, EMEA sales senior manager chez Seagate France. A ces points essentiels, rajoutons aussi la sécurité des données. A ce titre, les deux tiers des personnes sondées dans l'étude Rethink Data estiment ainsi que la sécurité de leurs données est insuffisante.
Source : infographie Rethink Data de Seagate
Dans ces conditions citées précédemment, les projets liés aux données (Big Data ou IA par exemple) n'aboutissent pas toujours : « Selon une étude du Gartner, seulement 50 % des projets IA lancés dans les 2 dernières années sont réellement déployés », affirme Antoine Le Bideau. Quant à leur implantation, entre 12 et 18 mois sont souvent nécessaires pour concevoir et déployer des pilotes IA.
DataOps : vers une démarche agile émergeante
Dans ce contexte, il est primordial de trouver des solutions et l’une des clés pourrait venir du DataOps. « Le DataOps prend en compte l’ensemble du cycle de développement et de mise en production autour des données », souligne Antoine Le Bideau. En effet, l’approche DataOps consiste à orchestrer une succession d’étapes par lesquelles les données passent au cours d’un projet data, ce dernier débutant par la collecte et l’agrégation de données à partir de sources variées, jusqu’à leur visualisation pour une utilisation métier. Pour IDC, le DataOps fait le liant entre les créateurs et les consommateurs de données. C’est en quelque sorte une démarche agile fortement inspirée du DevOps (collaboration entre les développeurs et les opérationnels). A ceci près que le DataOps implique bien plus de monde dans l’entreprise ; en plus de la DSI et des développeurs, le DataOps fait intervenir tous les métiers car, in fine, il s’agit bien de mettre en valeur toutes les données au service de toute l’entreprise.
En France, le DataOps peut être qualifié de démarche émergeante, ainsi 18,4 % des entreprises françaises auraient déployé le DataOps à petite échelle ou à grande échelle d’après le rapport Rethink Data. Toutefois, l’intérêt semble manifeste puisque 29,6 % indiquent avoir commencé cette approche DataOps et 36 % envisagent de le faire.
Source : infographie Rethink Data de Seagate
De leur côté, les acteurs mondiaux spécialisés dans la valorisation des données s’intéressent de plus en plus à cette démarche. Seagate fait partie de ces fournisseurs qui souhaitent contribuer à l’essor du DataOps en France et dans le monde. Comment ? En démocratisant, comme le rappelle Antoine Le Bideau, le stockage à des coûts compétitifs, c’est d’autant plus important que le volume de données devrait atteindre, d’après les chiffres d’IDC, les 175 Zettaoctets (175 milliards de téraoctets) en 2025, soit plus d’un disque dur Seagate de 18 To pour chaque habitant de la planète, sachant que nous sommes à l’heure actuelle 7,7 milliards de femmes et d’hommes. Pour ce faire, Seagate met en avant ses avancées technologiques comme le HAMR (Heat-Assisted Magnetic Recording), un procédé d’enregistrement magnétique assisté thermiquement dont l’objectif est d’augmenter significativement la capacité des disques durs permettant d’atteindre 20 To en fin d’année dernière et 50 To dans les cinq ans à venir. De même, Seagate aide, via sa solution de stockage objet Cortx en open source développée à l’initiative d’un groupe de recherche de la communauté européenne (Sage2 Project), à mieux valoriser les données. Cette solution permet ainsi de capturer et de consolider de manière efficace de grandes quantités d'ensembles de données non structurées pour un coût par pétaoctet le plus faible qui soit. « Depuis mon arrivée chez Seagate en 2003, nous avons multiplié par 2000 la capacité de stockage de données d’entreprise, avec une consommation 2000 fois moindre au To, c’est ce même esprit d’innovation qui nous anime pour répondre aux usages massifs actuels et à venir autour de l’IoT ou encore des smart cities », conclut Antoine Le Bideau.
(1) Le rapport Rethink Data a été réalisé sous la forme d’une enquête par Seagate et IDC auprès de 1500 personnes (500 dans la région Asie-Pacifique et Japon, 475 en Europe, 375 en Amérique du Nord et 150 en Chine).
(2) Issue de l’étude intitulée “ Notes from the AI frontier : Modeling the impact of AI on the world economy ” et réalisée par le cabinet McKinsey Global Institute.