Portée par la demande de ses clients, SingleStore, la société à l'origine de la base de données relationnelle SingleStoreDB, a décidé d'intégrer nativement Apache Iceberg à son offre pour aider les entreprises à exploiter les données stockées dans leurs data lakehouse. Ce format de table open source pour stocker des ensembles de données connait une popularité grandissante depuis plus d'un an auprès des entreprises. "Avec cette nouvelle intégration, SingleStore vise à transformer les données dormantes à l'intérieur des entrepôts de données en un atout précieux en temps réel pour les applications d'entreprise. Apache Iceberg, une norme ouverte populaire pour les entrepôts de données, offre aux DSI un stockage et un outil de requêtage efficients des grands ensembles de données", a déclaré Dion Hinchcliffe, analyste principal chez The Futurum Group.
Ce dernier a aussi souligné que l'intégration de SingleStore comprend des mises à jour qui aident ses clients à contourner les défis auxquels ils peuvent généralement être confrontés lorsqu'ils adoptent des méthodes traditionnelles pour rendre les données des tables Iceberg plus rapidement accessibles. Cela concerne notamment des flux de travail ETL (extraction, transformation, chargement) complexes et étendus, ainsi que des tâches Spark à forte intensité de calcul. Les principaux bénéfices qui en découlent sont de l'ingestion à faible latence, des flux de données bidirectionnels et de la performance en temps réel à moindre coût selon le fournisseur. Carl Olofson, vice-président de la recherche d'IDC, a déclaré que la société - anciennement connue sous le nom de MemSQL, une version optimisée pour la mémoire et très performante du système de gestion de base de données relationnelle - utilise les caractéristiques de la mémoire comme une sorte de cache. "Ce faisant, l'entreprise peut améliorer considérablement la vitesse à laquelle les tables Iceberg peuvent être interrogées et mises à jour", a expliqué le consultant, ajoutant que les entreprises pourraient charger de manière proactive les données d'Iceberg dans un format de mémoire interne optimisé.
La planète data store en ébullition
Avant l'intégration d'Iceberg, SingleStore conservait les données dans un format optimisé pour un transfert rapide vers la mémoire, où s'effectue tout le traitement des données, a expliqué l'analyste. Plusieurs autres fournisseurs de bases de données, notamment Databricks, ont tenté d'adopter le format de table Apache Iceberg en raison de sa popularité croissante auprès des entreprises. Au début du mois, Databricks a ainsi racheté Tabular, une plateforme de gestion de données fondée par les créateurs d'Apache Iceberg, afin de promouvoir l'interopérabilité des données dans les datawarehouse. Un autre format de gestion de données - Delta Live Tables - développé par Databricks, puis mis en libre accès par la Fondation Linux, est en concurrence avec les tables Iceberg. La société travaille actuellement sur un autre format qui permet aux entreprises d'utiliser à la fois les tables Iceberg et Delta Live.
Carl Olofson et Dion Hinchcliffe ont tous deux souligné que plusieurs fournisseurs et offres - tels que Polaris de Snowflake, BigQuery de Google, Starburst, Watsonx.data d'IBM, DataSphere de SAP, Teradata, Cloudera, Dremio, Presto, Hive, Impala, StarRocks et Doris - ont intégré Iceberg en tant que format de table analytique open source pour les très grands ensembles de données. L'intégration native d'Iceberg dans SingleStoreDB est actuellement en avant-première publique.
Des options de recherche et de déploiement supplémentaires
Dans le cadre des mises à jour de SingleStoreDB, la société ajoute aussi d'autres fonctionnalités à sa fonction de recherche en texte intégral qui améliorent l'évaluation de la pertinence, la similarité phonétique, la correspondance approximative et le classement basé sur la proximité des mots clés. La combinaison de ces fonctionnalités permet aux entreprises de ne plus avoir besoin de bases de données spécialisées supplémentaires pour créer des applications basées sur la GenAI explique l'entreprise.
En outre, SingleStoreDB a introduit une fonction d'autoscaling en bêta publique qui permet aux entreprises de gérer les charges de travail ou les applications en augmentant ou en réduisant les ressources informatiques. Elle donne aussi la possibilité aux utilisateurs de définir des seuils d'utilisation du CPU et de la mémoire pour l'autoscaling, afin d'éviter toute consommation inutile. En outre, l'entreprise a déclaré qu'elle introduisait une nouvelle option de déploiement pour la base de données via Helios BYOC, qui est une version gérée de la base de données via un cloud privé virtuel. Cette offre est maintenant aussi disponible en bêta privée sur AWS et les clients de SingleStore peuvent exécuter ce SGBDR dans leurs propres instances tout en se conformant aux politiques de localisation et de gouvernance des données selon l'éditeur.
Commentaire