En direct de San Francisco - Anciennement connue sous le nom de GPUdb, Kinetica, que nous avions déjà rencontré l’an dernier, est un vétéran sur le marché des bases de données accélérées par GPU. Cette solution a, en effet, été créée en 2009 pour répondre aux besoins de l'United States Army Intelligence and Security Command (INSCOM) de Fort Belvoir (Virginie) qui désirait suivre des millions de signaux différents en temps réel pour évaluer les menaces à la sécurité nationale. Les fondateurs de la start-up - Amit Vij et Nima Negahban – sont partis de zéro pour construire leur base de données centrée sur la parallélisation massive combinant la puissance de traitements des GPU et des CPU pour explorer et visualiser les données dans l'espace et le temps.
Aujourd’hui, Kinetica possède plus de 140 employés dans le monde avec des bureaux au Royaume-Uni et en Allemagne pour le marché européen. Parmi ses clients, on peut citer les Indonésiens d’OVO qui exploitent les capacités de la base de données pour construire une relation client en temps réel pour mieux servir leurs distributeurs de boissons dans les centres commerciaux. Le service postal américain, US Postal Service, optimise la distribution de son courrier au niveau mondial avec la solution. Accompagner l’essor attendu de la 5G est également une des priorités de Kinetica avec des opérateurs asiatiques comme Softbank et Telkomsel. L’idée est ici d’accélérer les analyses géospatiales pour optimiser la couverture réseau. Il s’agit d’accélérer le traitement des signaux mobiles pour augmenter les investissements dans certaines zones et améliorer les services. 50% des revenus de la société proviennent aujourd’hui de l’international, nous a assuré Daniel Raskin, directeur marketing de la société. La société ne gagne toujours pas d’argent et préfère investir pour développer ses ressources commerciales et R&D. « Le focus est aujourd’hui la croissance », a précisé Daniel Raskin. Un tour de table de série B est attendu dans les prochaines semaines pour accompagner cette ambition, comme nous avons pu le voir dans une slide qui ne nous était pas destinée.
Ce tableau de bord Kinetica Reveal permet ide suivre les prévisions des risques en temps réel.
Un périmètre élargi
Le champ d'application de cette base a été élargi pour devenir la plate-forme Kinetica Active Analytics. Cette dernière combine l'analyse des données historiques et en continu, la géolocalisation et l'apprentissage machine dans un ensemble optimisé et prêt pour le cloud (voir infographie ci-dessous). Kinetica combine sa base de données distribuée, en mémoire, accélérée par GPU avec des analyses en continu, l'intelligence de localisation et l'apprentissage machine. Vectorisée, en colonnes et conçue pour les charges de travail analytiques (OLAP), Kinetica distribue automatiquement toute charge de travail entre les CPU et les GPU. Kinetica utilise SQL-92 pour un langage de requête, tout comme PostgreSQL et MySQL, et prend en charge une gamme étendue de fonctionnalités, notamment la recherche de texte, l'analyse de séries chronologiques, l'intelligence de localisation et l'analyse graphique. « Active Analytics est connecté au monde réel pour accélérer les traitements analytiques et permettre aux entreprises de découvrir de nouvelles opportunités », indique le responsable marketing.
Disponible dans les clouds AWS, Azure et GCP, Kinetica est aussi déclinable on-premise.
Kinetica peut fonctionner sur l'ensemble du corpus de données en gérant intelligemment les données sur la mémoire des GPU, la mémoire système, les SSD, les disques durs et le stockage cloud compatible S3. « Notre architecture distribuée tire partie de tous les matériels [Dell EMC, Nvidia et IBM sont parmi les partenaires de la société] », a souligné Irina Farooq, chief product officer chez Kinetica. Selon la société, cette capacité à gérer tous les niveaux de stockage est un point qui la distingue de ses concurrents directs à savoir OmniSci, Brytlyt, SQream DB et BlazingDB.
Une montée en gamme vers SMACK
Grâce à ses capacités d'ingestion parallèle distribuée, Kinetica peut absorber à grande vitesse des ensembles de données en continu (avec Kafka) et réaliser des analyses complexes sur des données en continu et historiques simultanément. Il est possible de créer ou d’importer des modèles TensorFlow préformés pour exécuter des inférences via le traitement par lots, le traitement par flux ou un service cloud public.
Kinetica dispose d'une bibliothèque de fonctions géospatiales robuste et accélérée par le GPU pour effectuer le filtrage à la demande, l'agrégation, les séries temporelles, la jonction spatiale et l'analyse de géodata. La plateforme peut également afficher des géométries, des cartes thermiques et des contours illimités à l'aide d'une technologie de rendu côté serveur (puisque le rendu côté client d'ensembles de données volumineux prend beaucoup de temps). Avec toutes ces fonctionnalités, Kinetica dépasse le simple marché des bases de données accélérés et entre en concurrence avec une gamme beaucoup plus large de solutions, allant des solutions SMACK (Spark, Mesos, Aka, Cassandra et Kafka) sur-mesure aux plateformes plus traditionnelles de traitement et d'entreposage des données distribuées. Solution propriétaire, Kinetica propose aux entreprises un abonnement annuel basé sur le nombre de téraoctets en mémoire ; le stockage des données dans d'autres niveaux n’est pas facturé. La licence d'abonnement permet d'exécuter Kinetica n'importe où sur site ou dans le cloud. Les coûts d'abonnement sont totalement prévisibles. Un essai gratuit de 30 jours est disponible.
Commentaire