L'un des paradoxes du monde actuel axé sur l’exploitation intensive des données est que celles que nous cherchons à obtenir pour un avantage concurrentiel peuvent être à la fois une malédiction et une bénédiction. La multiplication des data lakes dans les entreprises n’a pas été en mesure de simplifier l’accès aux données pertinentes, c’est même bien souvent le contraire qui s’est produit. Pour survivre, les data lakes vont devoir commencer à prouver leur valeur commerciale en réussissant à combiner la découverte de l'information, le machine learning et le management des données pour offrir de nouvelles perspectives à l'entreprise.
C'est justement là où se positionne Alation. La startup fondée en 2012 par des anciens d’Oracle, de Google et d’Apple entend en effet aider les utilisateurs à mieux exploiter les données disponibles dans leur entreprise. « Les déploiements de grands hubs de données au cours des 25 dernières années (datawarehouse, gestion des données de base, lacs de données, Salesforce et ERP) ont donné lieu à un plus grand nombre de silos difficiles à comprendre, lier ou partager » relève Satyen Sangani, CEO et cofondateur de la société. Alation affirme que sa plate-forme homonyme peut simplifier l'accès aux données et permettre aux entreprises d'obtenir plus facilement les informations qu'elles recherchent. Elle offre des services d'analyse collaborative, de recherche et de découverte des données, d'optimisation et de gouvernance efficace. Chaque fois qu’une application mobile ou web est créée, il est nécessaire d’établir un pipeline de données, de proposer un tableau de bord ou développer un capteur, ce qui revient à créer un nouveau conteneur de données. Tous ces conteneurs ajoutent de la complexité et entrainent beaucoup de connaissances implicites. Et cette complexité rend les données moins accessibles, explique Alation.
Créer un catalogue exhaustif des données disponibles
La technologie développée par cette très secrète start-up exploite une combinaison d’apprentissage machine et de perspicacité humaine pour capturer une mine d'informations sur les données de l'entreprise, y compris ce qu'elles décrivent, d'où elles proviennent, qui les utilise et comment elles sont utilisées. Une autre façon de comprendre l'information consiste à examiner l'activité humaine qui l'entoure, a expliqué le CEO. « Comme Google, nous parcourons des centaines ou des milliers de systèmes de données au sein d'une entreprise et regardons non seulement les données, mais aussi les journaux d'utilisation » a complété Aaron Kalb, cofondateur et responsable produit de la start-up. L’adaptation aux différentes langues se fait grâce à l’exploitation du contexte et à l’utilisation des requêtes des utilisateurs qui enrichissent le système grâce au machine learning.
L'évolution du traitement des données : des silos historiques au data management. (Crédit S.L.)
Après avoir analysé – sans les déplacer - les données disponibles conservées en local (bases de données traditionnelles ou plateforme Hadoop/Spark) ou sur les clouds d'AWS, Azure ou GCP, Alation génère un catalogue de metadata riche et centralisé pour indiquer aux utilisateurs le moyen le plus rapide de trouver la bonne base de données, de formuler une requête, de soumettre une requête à un expert ou d'identifier une meilleure pratique dans son travail (avec un ranking des réponses aux questions déjà posées). « Si vous voulez répondre à une question, le fait de savoir que quelqu'un d'autre l'a déjà posée et la trouver peut être beaucoup plus efficace que de redécouvrir la réponse à nouveau » a souligné Aaron Kalb. La start-up essaie d’exploiter les connaissances déjà présentes dans ces systèmes pour découvrir des informations cachées et fournir des aperçus prédictifs plus pertinents et plus puissants pour proposer plus rapidement des réponses opérationnelles.
Déjà des clients en Europe
Alation est utilisée par des entreprises telles que BMW, eBay, EXpedia, GE, Square, Sony Entertainment et Allegro. La grande majorité des clients d'Alation utilisent aujourd'hui la plateforme pour traiter des données en local mais Expedia est par exemple en mode cloud. Signalons aussi que la start-up travaille avec des partenaires comme Cloudera, Hortonworks, Tableau ou Trifacta pour faciliter l'intégration de sa solution. La start-up a levé 32 millions de dollars (tours A et B) pour financer son activité. Elle possède déjà des bureaux en Allemagne et très bientôt au Royaume-Uni pour répondre aux besoins du marché européen à la veille de l’entrée en service de la directive GDPR.
Commentaire