Quelques mois après avoir ajouté des fonctionnalités de capture de données de changement (CDC) à faible latence à sa base de données NoSQL AstraDB, l’éditeur DataStax a annoncé mercredi qu’il livrait son service cloud géré Astra Streaming, jusque-là disponible en mode bêta. Basé sur le projet open source Apache Pulsar, Astra Streaming dispose d'un support intégré au niveau de l'API pour d'autres plateformes de streaming et de messagerie telles que Apache Kafka, RabbitMQ et Java Message Service (JMS), a indiqué Patrick McFadin, vice-président des relations avec les développeurs chez DataStax.
Créé à l’origine chez Yahoo, Pulsar s'est imposé comme un outil open source de gestion de flux d'événements susceptible de rivaliser avec Apache Kafka qui traite et fournit les changements des base de données en temps réel et distribue les résultats aux endroits choisis. Avec Astra Streaming, DataStax dit vouloir aider les entreprises à relever le défi du « cloud-native » et à trouver des solutions efficaces pour leur infrastructure existante. « Nous ne souhaitions pas nous borner à leur dire qu’elles devaient réécrire leurs applications de A à Z pour utiliser une nouvelle technologie. C’est pourquoi nous avons conçu Astra Streaming sur Pulsar et intégré le support d’autres services de streaming et messagerie populaire tels que Kafka », explique M. McFadin.
La tarification d'Astra Streaming se fait sur un mode « pay-as-you-go » et les environnements multiclouds sont pris en charge. Son coût de possession devrait donc être inférieur à celui des autres services de messagerie et de streaming, selon Chris Latimer, vice-président de la gestion des produits chez DataStax. « Nous avons constaté que si les entreprises apprécient l'API Kafka, elles sont de plus en plus frustrées par son architecture tentaculaire et par les coûts élevés de licences nécessaires pour que Kafka soit prêt pour l'entreprise », assure-t-il.
Une demande en hausse sur les applications temps réel
La demande pour des applications interactives en temps réel s’est accrue dans les entreprises ces dernières années, pour chercher à contrebalancer les effets des différents aléas économiques et géopolitiques subis. Ce qui par ricochet augmente le besoin de gestion des flux de données en temps réel en recourant à des services tels qu’Astra Streaming. « Les échanges commerciaux se déroulent en temps réel, et le traitement des flux de données est impératif pour les entreprises afin d’optimiser les décisions, les actions et les expériences », souligne Amy Machado, directrice de recherche Che IDG. « Le streaming de données peut changer la donne et permettre de prendre des décisions commerciales de façon prédictives et d’acquérir des avantages concurrentiels ».
Le lancement du service géré de DataStax pourrait aussi contribuer à éliminer les contraintes liées aux silos de données et à mieux prendre en charge les applications modernes. Pour Matt Aslett, directeur de recherche chez Ventana Research, cela augmente ses chances d’être adopté par les développeurs. Il rappelle que les services gérés sont plus facilement adoptés car ils permettent de s’affranchir de la configuration de l'infrastructure, de sa gestion et de sa surveillance opérationnelle continue. En outre, associé à la base de donnée AstraDB, il permettra de supporter des applications reposant sur des données en mouvement qui constituent l’épine dorsale des traitements analytiques en temps réel.
Qu'est-ce que le data-in-motion ?
Les données en mouvement (data-in-motion) circulent entre les terminaux connectés en périphérie et la base de données. Les applications qui reposent sur ces données ont la capacité de les traiter et de fournir ainsi des mises à jour en temps réel. Astra Streaming peut être utilisé pour créer des pipelines afin de transporter les données vers et depuis AstraDB en temps réel. Dans ce cas, Astra Streaming sert de composant CDC central d'AstraDB, permettant la synchronisation des données d'Astra DB vers d'autres plates-formes de données et applications au fur et à mesure de la mise à jour de la base de données, explique Matt Aslett. Mais Astra Streaming peut aussi être utilisé sans être combiné avec la base de données.
Ce nouveau service devait aussi compléter Astra DB sur les capacités de géoréplication. Pulsar peut en effet s'étendre sur plusieurs datacenters dans différentes régions géographiques, selon Sanjeev Mohan, ancien vice-président de la recherche sur le big data et l'analytique chez Gartner.