Progressivement, les hyperscalers adaptent et positionnent leurs services de base de données pour les applications d’IA. C’est le cas de Google Cloud qui vient d’annoncer une vague de mise à jour de plusieurs services. Ainsi Spanner, l’offre de base de données SQL distribuée entièrement managée se voit doter de traitement des graphes (sous l’appellation Spanner Graph). Pour les analystes, ces capacités devraient permettre aux développeurs de créer plus facilement des applications pour des cas d’usage de l'IA comme des systèmes de recommandation plus pertinents et la détection des fraudes.
Selon Steven Dickens, consultant chez The Futurum Group, Spanner Graph répond à la demande croissante de solutions avancées de traitement des données et d'analyse de la pile d'IA dans divers secteurs d'activité. « Les bases de données en graphe sont particulièrement utiles pour le RAG (Retrieval-Augmented Generation) car elles excellent dans la modélisation et l'interrogation de relations complexes entre les points de données. Cette capacité améliore la recherche d'informations pertinentes dans les applications d'IA, et donc la précision et la pertinence des résultats générés », a déclaré M. Dickens.
Selon Tony Baer, analyste principal chez dbInsight, l'augmentation de la demande de graphes de connaissance et le modèle RAG par graphe, qui peut fournir un contexte, en rendant explicites les relations entre les intégrations vectorielles, explique aussi l'ajout de la fonction traitement des graphes. Spanner reste « essentiellement un système de gestion de base de données relationnelle (SGBD) » et enregistre les données en interne, y compris les données graphes sous forme de tableaux avec des lignes et des colonnes, a expliqué pour sa part Carl Olofson, vice-président de la recherche d'IDC. « Avec cette possibilité, les utilisateurs peuvent ajouter des graphes aux bases de données relationnelles existantes et utiliser les mathématiques des graphes pour traiter les données des tableaux », a-t-il ajouté. Il estime par ailleurs qu’en termes de performances, Spanner ne pourra peut-être pas « vraiment défier » les bases de données graphes spécialisées, comme Neo4j, OrientDB, TigerGraph et Aerospike Graph, qui prennent en charge les déploiements de graphes purs.
Bases de données multi-modèles et spécialisées
« La décision de Google d'ajouter des capacités de traitement des graphes à Spanner s’inscrit dans la tendance des vendeurs de solutions SGBD, qui veulent être perçus comme des fournisseurs de soutien stratégique aux bases de données en aidant les entreprises à consolider leurs besoins en database, à ajouter des capacités multi-modèles ou des fonctionnalités offertes par des bases de données spécialisées », a expliqué M. Olofson. C’est ce que font déjà des fournisseurs comme Oracle, AWS, Microsoft, Google et MongoDB en ajoutant des capacités vectorielles. Auparavant, celles-ci n'étaient proposées que par des bases de données spécialisées comme Pinecone, Weaviate et Milvus.
De la même manière, selon Alexander Wurm, analyste principal chez Nucleus Research, en ajoutant des traitements des graphes à Spanner, Google se met en position de rivaliser avec des bases de données comme Neo4j, Amazon Neptune et Microsoft Azure Cosmos DB. « Ces fonctions de graphes vont simplifier les tâches de gestion des données pour les développeurs, car ils pourront désormais utiliser une seule plateforme pour interroger les données structurées et connectées, et faciliter ainsi la gestion de plusieurs bases de données », a fait remarquer M. Dickens, ajoutant que ce gain d'efficacité facilitera le business. Par ailleurs, Tony Baer, analyste principal chez dbInsight, a souligné que Spanner Graph comblait une lacune dans le portefeuille de bases de données cloud de Google, d’où la fonction était « jusqu'à présent manifestement absente ». « Google commence probablement par Spanner, car le fournisseur veut s'attaquer à l'évolutivité horizontale, qui a longtemps été le talon d'Achille des bases de données en graphe », a avancé M. Baer.
Interopérabilité entre GQL et SQL
Selon Andi Gutmans, vice-président de l'ingénierie des bases de données de Google, dorénavant, Spanner Graph, ou Spanner en général, prendra en charge le langage de requête graphique (GQL) et la base de données offrira également une interopérabilité avec SQL. Selon les analystes, l'interopérabilité avec SQL fera profiter Google de l’usage courant et généralisé de SQL par les développeurs et les experts des données, qui n’auront pas à apprendre un autre langage de requête. Google a aussi indiqué que Spanner serait disponible sous une autre forme, baptisée Spanner Editions, et qu’elle inclurait la base de données cloud avec les éditions Standard, Enterprise et Enterprise Plus. « Les trois éditions, dont les tarifs sont différents, devraient cibler plus d'entreprises et offrir plus de flexibilité », a ajouté le fournisseur.
Support SQL pour Bigtable
L’ajout du support SQL au service de base de données NoSQL Bigtable, qui comprend plus de 100 fonctions SQL, fait partie des autres mises à jour apportées par Google. « De K-NN (K-nearest neighbors) pour le développement d'applications d'IA générative à la manipulation de JSON pour le traitement des journaux, en passant par l'utilisation de croquis de données pour l'analyse en temps réel, il est désormais plus facile que jamais de construire des applications en temps réel et à haute performance », a déclaré Andi Gutmans de Google, pour justifier l'ajout de la prise en charge de SQL à Bigtable. Selon M. Dickens, du Futurum Group, le support de SQL répondra aux besoins évolutifs des développeurs et des entreprises qui cherchent à tirer parti des performances et de l'évolutivité de Bigtable à l'aide de requêtes SQL familières. « Le timing de cette mise à jour reflète la pression qu’exercent les fournisseurs de bases de données cloud rivaux et la demande croissante d'analyses en temps réel, ainsi que le besoin de solutions de bases de données évolutives pouvant gérer divers types de données et charges de travail », a déclaré M. Dickens.
Selon lui, le support de SQL rend aussi Bigtable plus compétitif sur le marché, et il pourra ainsi attirer une base d'utilisateurs plus large et inciter à une utilisation plus étendue des services cloud. « Aujourd’hui, les hyperscalers ciblent la gravité des données et cherchent à déplacer les données vers leurs plateformes cloud pour fournir une base pour les cas d’usage de l'IA ». Dans un autre communiqué, le fournisseur a annoncé la disponibilité générale de connecteurs Spark pour PySpark, Scala et SparkSQL afin d’aider les scientifiques des données à construire des pipelines de données et à former de grands modèles d'apprentissage machine sur Bigtable.
Commentaire