Si les solutions de data management se démarquent aujourd'hui sur le marché du stockage, c'est que l'arrivée des big data a rendu infernal le travail des équipes IT dans les entreprises. On ne jette plus rien de peur de passer à côté de la prochaine poule aux oeufs d'or, forcément dissimulée dans toutes les données collectées et générées par les clients et les utilisateurs. La start-up Komprise vient donc répondre à cette problématique avec une solution de gestion des données reposant sur l'analytique.
Spécialisée dans la gestion de données, la start-up Komprise (compose and comprise) a été cofondée en 2014 par Krishna Subramanian (présidente et COO), une figure historique de la Silicon Valley et ancienne responsable du développement chez Sun, et Kumar K. Goswami (CEO). Tous deux étaient déjà associés dans leur précédente start-up Kaviza, axée sur la réduction de la complexité et des coûts des solutions VDI, acquise en 2001 par Citrix.
Aujourd’hui, leur jeune pousse se focalise sur la question de l’utilisation des ressources de stockage dans les entreprises et plus particulièrement de savoir qui utilise quoi, en quelle quantité, et avec quel besoin en back-up. La croissance massive des données – dans la recherche génomique, elle double par exemple tous les trimestres – amène aujourd’hui les administrateurs à repenser leur organisation. Comme les budgets IT restent atones, les équipes doivent faire plus et mieux avec les mêmes crédits, a souligné Krishna Subramanian. Alors quels sont les leviers disponibles pour mieux utiliser les ressources existantes. L’automatisation de la gestion est assurée grâce à une analyse poussée des données et métadata des fichiers pour savoir lesquelles ne sont jamais ou rarement utilisées, quel type de données est conservé et qui les utilise. « 99% des requêtes des utilisateurs concernent des données », a souligné la COO.
Une appliance combinée à une console cloud
Il s’agit de mieux répartir les données chaudes et plus froides tout en générant de substantielles économies - avec une approche plus dynamique, flexible et efficace en matière de gestion – pour justifier le recours à une solution de data management plutôt que de rajouter toujours plus de capacité. L’analyse des données structurées et non structurées en local et dans le cloud s’effectue sur le réseau de manière non intrusive – sans agent sur les systèmes de stockage et les serveurs – pour dresser un état des échanges. « Nous nous situons derrière le datapath, entre le stockage primaire et secondaire », nous a précisé Krishna Subramanian, pour analyser l’usage des fichiers coincées dans des silos.
Komprise ne propose pas d’appliance dédiée pour démarrer sa solution mais une VM pour VMware ESXi - la prise en charge des hyperviseurs KVM et Microsoft Hyper-V est sur la roadmap - avec la solution maison pour scanner les adresses IP des baies de stockage avant de regarder plus précisément les entrailles du système. Combien de données sont stockées, quel est leur âge, à quand remonte leur dernière utilisation… Le logiciel ne consomme pas plus de 2,5% de la bande passante réseau disponible pour assurer ses analyses. Si le trafic réseau augmente, Komprise se retire jusqu'à ce que de la bande passante excédentaire soit disponible. La solution se déploie sans interrompre l’activité, avec une console dans le cloud pour gérer et analyser les informations remontées par la VM sur les données locales et dans le cloud. « On peut également voir ce que deviennent les données, quel groupe d’utilisateurs les demandent… Des informations dont les équipes IT ont besoin pour prendre les bonnes décisions et définir les politiques d’utilisation des applications », ajoute la dirigeante. Et pour réduire le coût de la réplication, les données froides sont transférées dans le cloud. Plusieurs clouds publics sont supportés par la solution de Komprise en NFS et en mode objet. Le déplacement des données est réalisé avec chiffrement pour assurer leur sécurité.
Indexation des métadonnées
Comme pour toute solution de data management, on retrouve chez Komprise une fonction de recherche avec indexation sur les métadonnées et le contenu. « Mode fichier, bloc ou objet, cela n’a pas d’importance, nous pouvons accéder à toutes les données. Nous avons commencé avec NFS car c’est un protocole populaire et qu’il y a énormément de monde qui l’utilise », précise la COO. 44 personnes travaillent aujourd’hui pour la start-up aux Etats-Unis et en Inde à Bengalore. Parmi les clients de la société, on peut citer l’assureur AIG, Pacific Biosciences dans la recherche génomique ou encore Electronic Arts.
Commentaire