En direct de San Mateo - Fondée en 2013 à San Mateo, la start-up AtScale a pris le train Hadoop en marche avec comme positionnement le rapprochement de l’analytique et de la gestion des données. « Nous demandons aux clients ce qu’ils veulent faire avec Hadoop ; il y a 10 ans c’était la gestion des données, aujourd’hui ils sont passés à l’analytique. Voilà pourquoi nous travaillons beaucoup avec des gens comme Tableau pour réconcilier les deux mondes », nous a indiqué Bruno Aziza, CMO de la start-up. Sans vraiment déplacer les données - un cube virtuel transforme toutefois les données Hadoop dans un serveur OLAP haute performance - la plate-forme AtScale Intelligence Platform 3.0 s’interface entre Hadoop et les outils analytiques pour proposer une plate-forme en self-service.
Avant AtScale, Bruno Aziza est notamment passé par Microsoft (marketing SQL Server) et la start-up SiSense.
« Nous nous focalisons sur le fourniture de business data pour les outils BI », nous a expliqué le CEO de la jeune pousse, Dave Mariani, un ancien de Klout et Yahoo (vice-président en charge des développements analytiques chez ce dernier). L’interface de contrôle est entièrement HTML pour gérer les commandes et les envois de données. « Mais il n’y a pas de data streaming, nous interceptons les requêtes des outils BI, nous les traitons pour les adapter à Hadoop. C’est notre sauce secrète ». S’il est peut être abusif de parler d’une plate-forme data scientists killer, AtScale se positionne néanmoins comme une alternative à ces derniers.
Un moteur maison pour traquer les requêtes
Faute de compétences, les entreprises ne sont pas encore toutes prêtes à déployer des solutions BI exploitant de manière efficace les données stockées sur une plate-forme Hadoop que ce soit au niveau des performances, de la gouvernance ou encore de la gestion des demandes. Hadoop est bien connue pour sa flexibilité et son évolutivité, mais la plate-forme n'a pas été conçue pour répondre aux très nombreuses requêtes interactives provenant des outils BI standard. Jusqu'à présent, les solutions disponibles pour résoudre ce problème de performances et d’accès s’appuyaient sur l'indexation des données, la transformation ou le mouvement des données via des processus complexes et couteux orchestrés par des data scientists.
L’équipe d’AtScale propose donc de prendre en charge une partie de cette complexité avec AtScale Intelligence Platform 3.0 qui apporte un certain nombre d'innovations autour de la sécurité et de l'évolutivité, notamment grâce à la technologie Adaptive Cache. Cette fonction est en fait un moteur qui observe les requêtes des utilisateurs accédant à la box virtuelle d’AtScale afin de mettre en cache les données pour un accès plus rapide la fois suivante. Ce moteur tire parti de cet apprentissage progressif pour détection les changements et pousser les nouvelles données quand elles sont disponibles.