Les énormes volumes de données échangées aujourd’hui ont attiré vers le marché des bases de données de nouveaux acteurs ayant chacun des atouts et des spécificités. Splice Machine fait partie de ceux-là. Jusqu’ici, Splice Machine avait surtout investi dans les capacités de mise à l’échelle de Hadoop. Mais, depuis mardi, l’entreprise a choisi de miser aussi sur la technologie in-memory d’Apache Spark.
Actuellement en version bêta publique, Splice Machine 2.0 intègre le moteur open source d’Apache Spark dans son architecture existante basée sur Hadoop. Grâce à cette combinaison, Splice peut désormais proposer aux entreprises une base de données SQL hybride, flexible, qui leur permet de traiter en même temps des charges de travail transactionnelles et analytiques. « La plupart des systèmes in-memory obligent de stocker toutes les données en mémoire », avait déclaré le mois dernier dans une interview Monte Zweben, le CEO de Splice Machine. Ces technologies peuvent vite devenir prohibitives quand le volume de données augmente de façon importante. « Dans notre solution, tout le calcul se fait en mémoire, mais le stockage des données peut avoir lieu ailleurs », avait-il précisé.
Une technologie in-memory hybride
Splice Machine 2.0 utilise le calcul in-memory pour accélérer l'analyse BI, mais se sert de la base de données HBase de Hadoop pour stocker et accéder durablement aux données, tout en conservant les capacités de mise à l’échelle. « Les avantages du système sont un coût très inférieur et une vitesse plus élevée », a déclaré Monte Zweben. « Notre objectif était d'utiliser le traitement en mémoire pour créer une technologie hybride intégrée », a-t-il ajouté. « Notre base de données pourra traiter les transactions simultanément avec les tâches de BI sans entraver les unes ou les autres ».
En répartissant les processus et la gestion des ressources entre Hadoop et Spark, le système de gestion de base de données relationnelle (SGBDR) de Splice Machine évite que les requêtes complexes d'analyse ne gênent les opérations transactionnelles assujetties à des contraintes de temps. Les utilisateurs peuvent d’ailleurs établir des niveaux de priorité pour le traitement des requêtes analytiques afin que les rapports importants ne restent pas bloqués jusqu’à la fin d’un processus en batch qui consommerait toutes les ressources du cluster.
Un outil dédié au data lake et au marketing digital
Selon Splice, la solution est 10 à 20 fois plus performante que les systèmes traditionnels de gestion de bases de données relationnelles, et coûte quatre fois moins cher. « Splice Machine 2.0 est particulièrement bien adapté au marketing digital, aux lacs de données opérationnelles, au déchargement des données dans les entrepôts de données et à l'Internet des objets », a-t-il ajouté. « L'avantage ultime, c’est que la solution permet de prendre des décisions en temps réel ».