Créé il y a 10 ans, Qumulo propose une solution de stockage hybride (local et cloud) taillée pour les grands volumes de données structurées. Reposant sur une plateforme exploitant des SSD et des HDD ou full flash selon les besoins, l'offre du fournisseur s'articule autour d'un logiciel, Cloud Q, supportant les environnements AWS, Google Cloud et très bientôt Microsoft Azure. Mais aussi, en partenariat avec HPE et Fujitsu, d'une infrastructure serveur pouvant être internalisée dans les datacenters des entreprises. Fondé notamment par des anciens d’Isilon System (Aaron Passey, Neal Fachan et Peter Godman), racheté par EMC en 2010, Qumulo mise sur la simplicité (prise en mains et utilisation) pour séduire les entreprises et faciliter la gestion de leurs clusters de stockage dont le nombre de noeuds s'étend à plusieurs centaines. Il compte aussi se différencier d'acteurs comme Isilon ou encore NetApp avec le support d'une grande variété de sources de données, sa capacité de scale-out et de visibilité temps réel sur les des données ainsi que l'automatisation des tâches d'intégration.
En France, l'activité a démarré juste avant la période de crise sanitaire mais s'avère particulièrement prometteuse. « La France a toujours été un territoire important et en top des priorités des régions qui grossissent », a lancé César Fétiveau, directeur commercial de Qumulo en France. Le dirigeant vient d'ailleurs de lancer de la 4e édition de son événement QumuloNight ce 7 avril 2022. « Le retour sur le terrain permet d'accompagner très forte croissance en France depuis mi-2019 et de renforcer la présence dans tous les secteurs historiques médias, divertissement et santé ». La dynamique de croissance - 30 clients à ce jour dans l'Hexagone dont le prestataire de servies audiovisuels Cognacq-Jay Image - se concrétise sur de nombreux marchés, pas seulement d'ailleurs sur les segments historiques que sont les médias et divertissements et la santé, mais aussi le secteur public, la recherche, la surveillance... « Nous avons renforcé nos partenariats technologiques ainsi qu'avec des intégrateurs locaux », poursuit César Fétiveau.
Zoom sur les dernières fonctionnalités
Insistant sur sa logique de développement agile en mode sprint avec une release toutes les deux semaines « pour ajouter, corriger et apporter des améliorations par touches », Qumulo a profité de l'occasion pour revenir sur ses dernières avancées. Déployables au travers des templates AWS CloudFormation et Terraform, les instances Qumulo CloudQ (4 à 20) peuvent désormais supporter jusqu'à 6 Po chacune dans le cadre du framework well architectured d'AWS. Actuellement, 50% des usages des clients Qumulo sont de type full cloud. Concernant la structuration de la rétrocompatibilité, le fournisseur reconnait un certain flou qu'il s'évertue aujourd'hui à combler : « au préalable, nous avions des clusters capables de se répliquer les uns avec les autres, mais nous ne savions pas lors d'une montée de version si cette compatibilité était prise en compte. Nous l'avons renforcée dans le code et on ne pourra donc pas répliquer deux clusters qui ont plus de deux versions de différence ce qui permet de laisser de la flexibilité pour les montées de versions sur les systèmes de stockage primaire et secondaire », explique Alexandre Hermier, ingénieur systèmes chez Qumulo France. Parmi les autres nouveauté, on trouve également la possibilité de redémarrage séquentiel ou global lors du processus de mise à jour du micrologiciel serveur, ce qui permet d'étaler et de réduire les plages d'indisponibilités de service. Le protocole NFSv3 est aussi amélioré avec le support de Nconnect pour, à partir d'un export NFS, de créer plusieurs flux en lecture/écriture dans plusieurs canaux et sur plusieurs interfaces (1GbE, 10GbE...). Avec à la clé une meilleure performance en termes d'agrégation et de parallélisation des flux.
« Le cluster Qumulo sert à stocker des données non structurées avec un mode d'accès protocolaire fichiers comme FTP, SMB, NFS y compris HTTP via API REST », poursuit Alexandre Hermier. « On a commencé à développer S3 sur le frontal du cluster, c'est une implémentation très discutée, mais aussi très demandée que l'on n'a pas voulu faire à l'emporte-pièce ». D'abord proposé en lecture seule, cette fonction va évoluer ensuite pour s'étendre bien au-delà du scénario de protocoles fichiers pour aller par exemple vers le back-up et les nouvelles apps maison développées pour accéder à de nombreux développements de type microservices habituées à communiquer en API REST. « Plutôt que de monter un espace dans K8's avec un export NFS pour accéder à des jeux de données sur des stockages persistants, l'idée est de le mettre en partage de données entre les utilisateurs et les applications », explique Alexandre Hermier. Parmi les autres fonctions récentes on citera entre autres le checksum (pour comparer par rapport à un état d'origine les erreurs relatives à des changements des données) qui ne sera toutefois pas présent sur les solutions entrée de gamme K-144T et K-168T. Ou encore Atime (mises à jour des opérations, des répertoires, des temps d'accès...), CSI Driver for K8's pour accéder aux données persistantes et Metric-API un format d'API standardisé pour remonter des éléments de supervision au niveau du cluster ainsi que nfsv4.1 pour davantage de sécurité.
Des cas d'usages au rendez-vous en France
Outre les évolutions techniques, Qumulo a profité de son événement pour mettre en avant des cas clients. Chez Portalliance, spécialisé dans la simulation numérique pour le secteur aéronautique, le duo Fujitsu-Qumulo a été sélectionné fin 2019 dans le cadre d'un projet d'infrastructure HPC hébergée. Avec comme critère de choix principaux la scalabilité et la performance pour faire communiquer son système de calcul avec le cluster de stockage en réseau dans un contexte de grosse volumétrie de données non structurées. Du côté de l'éditeur Fichorga, spécialisé dans les solutions de gestion notariale, la question de l'accès à un grand nombre de fichiers simultanés a aussi été cruciale. Les utilisateurs, notaires et clercs, ouvrent en effet entre 400-500 fichiers toutes les minutes et la limite des clusters Windows de 16 millions de fichiers a été atteinte, nécessitant des coupures de service, ce qui n'est plus le cas avec Qumulo. En production depuis novembre 2021, cinq mois après l'initialisation du projet, l'infrastructure de 4 noeuds mise en place gère 70 To de données pour un total, à terme, de 260 millions de fichiers. Mais la limite est loin d'être atteinte, Fichorga estimant être seulement à 15% de la capacité d'IOPS de sa plateforme ce qui laisse de quoi voir venir.
Commentaire