Mark Porter dirigeait le service de bases de données relationnelles Relational Database Service (RDS) et Aurora d'AWS. Avant cela, il a passé plus de dix ans chez Oracle. Aujourd'hui, il est le directeur technique de MongoDB. Son parcours - il a travaillé chez trois pionniers des bases de données – le place dans une position intéressante pour commenter l’environnement des bases de données et son évolution. Alors, que dit-il aujourd’hui ? Déjà, selon lui, les anciennes divisions entre « back office et front office [sont] en train de disparaître ». Autrement dit, les systèmes d'enregistrement et les systèmes d'engagement, autrefois clairement distincts, sont en train de fusionner. Si c’est effectivement le cas, que signifie ce rapprochement pour les entreprises qui tentent désespérément de moderniser leurs stratégies en matière de données ? Selon M. Porter, il est temps pour elles de « penser au-delà de la base de données et de mettre en place une véritable « plateforme de données » capable de traiter, stocker, sécuriser et analyser les données en temps réel, sur tous les ensembles de données pertinents ». Mais n'est-ce pas là une nouvelle façon fantaisiste d'essayer de réimaginer les entrepôts de données et les lacs de données ?
Des machines qui posent des questions
Pendant longtemps, les données étaient vraiment très différentes. Les systèmes de back-office reposaient sur des données structurées, bien rangées en lignes et en colonnes. Á l’époque, ces bases de données relationnelles apportaient une innovation étonnante, et jusqu’à aujourd’hui elles continuent de rendre de grands services aux entreprises. Mais, comme je l'ai écrit il y a quelques années, « le monde confortable de la base de données relationnelles structurées est de plus en plus remis en question par les montagnes de données non structurées ou semi-structurées. La plupart de ces nouvelles données sont créées par ce que Geoffrey Moore appelle des systèmes d'engagement, même si les dernières décennies ont été construites sur des systèmes d'enregistrement (comme les systèmes ERP et CRM) ».
Mark Porter va encore plus loin en ajoutant un troisième type de système, les « systèmes de compréhension ». Comme l'explique le directeur technique de MongoDB, « pendant des décennies, les entreprises ont maintenu des systèmes d'enregistrement et des systèmes d'engagement. Les premiers sont des sources de vérité fondamentales, critiques pour le bon fonctionnement de l’activité, auxquelles accèdent principalement les programmes et les utilisateurs internes. Les systèmes d'engagement sont les interfaces numériques avec lesquelles les clients et les employés interagissent. Récemment, nous avons vu qu’à ces systèmes se sont ajoutés des systèmes de connaissance. Ces derniers combinent des données provenant de diverses sources pour éclairer la prise de décision dans toute l'entreprise. Pendant longtemps, chaque système fonctionnait sur des ordinateurs différents, avait d’autres exigences en matière de gestion des données et était financé par des départements distincts ».
Cependant, les entreprises ne peuvent plus faire face avec des systèmes statiques fonctionnant en silo, qui n'interagissent pas avec les autres données et ont du mal à évoluer. « Les choses vont trop vite, et les machines commencent à poser les questions », écrit encore M. Porter. « Avec l'essor de l'apprentissage et de l'inférence de modèles, un autre type d'analyse est en train de voir le jour. Cette fois, ce sont les programmes qui interrogent les systèmes d'analyse et ils réagissent aux réponses en temps réel. Ce ne sont plus les humains qui posent les questions et écrivent ensuite des programmes pour les mettre en œuvre. Il s’agit d’un changement fondamental, si fondamental que l'on pourrait le comparer au passage des mainframes IBM 7090 qui alimentaient dans les années 1950 le système de réservation Sabre, à ceux qui alimentent (alimenteront ?) le programme SKYNET de la NSA. »
Une seule plateforme de données pour les gouverner toutes
Que doivent donc faire les entreprises ? La réponse de Mark Porter pourrait étonner un directeur technique d'une société de bases de données : « Cette convergence des systèmes intervient à un moment où la plupart des entreprises mènent des projets de transformation numérique radicale afin de devenir des entreprises axées sur l'innovation, sur les logiciels et sur le cloud. En d'autres termes, même si tout le monde est déjà bien occupé, il n'y a jamais eu de meilleur moment pour penser au-delà de la base de données, et de concevoir une véritable plateforme de données capable de traiter, stocker, sécuriser et analyser les données en temps réel, à travers tous les ensembles de données pertinents - soit sans copier les données, soit en rendant cette copie invisible. »
De quelle façon MongoDB pense au-delà de la base de données ? Pour l'instant, l’éditeur continue de qualifier sa base MongoDB de « base de données pour les applications modernes ». M. Porter indique qu'il écrira sur ce qu'il entend précisément par là dans les prochains mois. Mais l’on peut déjà trouver quelques indices sur le site Web de MongoDB. Par exemple, cette présentation « Kubernetes, MongoDB, and Your MongoDB Data Platform » explique comment les entreprises peuvent s'appuyer sur le portefeuille de services de MongoDB, notamment la base de données Atlas gérée dans le cloud, un lac de données, la recherche et les services de développement d'applications. Tout cela semble très proche de ce que Snowflake appelle sa « plateforme de données dans le cloud ». Dans les deux cas, ces entreprises tentent de donner aux clients la possibilité d'intégrer et d'interroger des données en un seul endroit. Et elles ne sont pas les seules.
Est-ce que ça va marcher ? Nous verrons bien. L'industrie recherche ce saint Graal depuis un certain temps. Nous avions l'habitude d'appeler ça « lac de données » (et ça ne s'est pas bien terminé !) et maintenant ces plateformes incorporent à la fois des lacs de données et des entrepôts de données, en essayant de les surpasser. Mais ce n'est pas parce que ces tentatives ont globalement échoué hier qu'elles ne réussiront pas demain. Et, compte tenu de l'expérience de Mark Porter, cela vaut la peine de suivre sa réflexion sur la façon dont les bases, les entrepôts et les lacs évolueront pour devenir des plateformes qui vont vraiment au-delà de la base de données… et du discours marketing.