Depuis notre dernière rencontre en février 2022, l’équipe de Hammerspace s’est considérablement renforcée avec le rachat du français Rozo Systems en mai 2023 pour sa technologie d’Erasure Coding reposant sur l’algorithme Mojette, puis la levée de 56 M$ en juillet 2023 avec Prosperity7 Ventures, ARK Invest, Pier 88 Hedge Fund, Samsung et d'autres investisseurs. Fondée en 2018 par David Flynn (à l’origine de Fusion.IO et Primary Data), Hammerspace vient aider les entreprises à mieux gérer et partager leurs données avec une plateforme baptisée Global Data Environment (GDE). Indépendante des infrastructures (NAS, SAN ou cloud), cette solution d’orchestration des données parallèle (grâce au support de pNFS) se situe au-dessus de tous les silos, et permet un accès facile et transparent aux données, où qu'elles se trouvent, localement ou à distance, sur site ou dans le cloud.
La plateforme GDE de Hammerspace découple les données des supports de stockage en recourant aux métadonnées.
« Le problème que nous voyons, et cela s'applique à toutes les industries, c'est que les utilisateurs accèdent à leurs données par le biais d'un système de fichiers. Et ce dernier, avec la technologie de stockage actuelle, est généralement intégré dans la plateforme de stockage elle-même, ce qui est bien, si vous n'avez qu'une seule plateforme de stockage. Mais dès que vous ajoutez une autre plateforme de stockage, vous avez un autre système de fichiers et un autre point d'accès. Et plus vous ajoutez de types de stockage, plus vous ajoutez d'emplacements, plus vous fragmentez vos données. Et il devient très difficile pour les utilisateurs d'y accéder. Mais aussi, et surtout, il devient très difficile pour les administrateurs d'y accéder, ce qui a donné naissance à une industrie en pleine croissance dans les solutions ponctuelles pour surmonter ce problème de silos », a rappelé David Flynn lors d’un IT Press Tour à San Matteo, dans la Silicon Valley. « En adoptant une approche différente, Hammerspace élever le système de fichiers au-dessus de la couche d'infrastructure, de sorte que l'orchestration des données peut désormais être faite globalement; nous le faisons en simulant les métadonnées hors du stockage existant, donc les données peuvent rester en place, nous n'avons pas à migrer les données, nous n'avons pas à les mettre dans une nouvelle plate-forme ». GDE dissocie la présence physique des données avec les systèmes de fichiers exposés via les protocoles de partage standard tels que NFS et SMB et affiche un système global de fichiers virtuels.
L'un de ses aspects essentiels est la base de données centrale en temps réel, disons le catalogue, résidant sur le serveur de métadonnées, instanciée avec RocksDB.
Cette petite introduction terminée, penchons-nous la principale nouveauté de Hammerspace annoncée lors du dernier SC23 : la prise en charge des systèmes d'archivage à bande dans son GDE avec une extension évidente vers S3-to-tape. L'accès aux données à distance de Hammerspace, qui utilise la solution logicielle de Vcinity, supporte donc en sus les systèmes à bande. Les fichiers stockés sur bande sont désormais visibles dans le GDE et apparaissent comme des données actives, au même titre que celles stockées sur n'importe quel autre type de stockage. Les archives sur bande sont toutefois supervisées par un logiciel de gestion différent de ceux utilisés pour les sauvegardes sur bande. Ces dernières sont des collections de fichiers et de mises à jour dans un conteneur unique ou fichier de sauvegarde très souvent propriétaire. Ce dernier n'est exploitable que par le logiciel de sauvegarde ou un outil de migration et il s'agit de copies de fichiers composants, et non des données actives originales. Les archives, gérées par des logiciels d'archivage, sont des fichiers originaux dont les taux d'accès sont faibles et qui sont accessibles par l'intermédiaire d'un logiciel d'archivage, qui enregistre et conserve leurs métadonnées. Pour travailler avec les systèmes à bande, principalement dans les environnements HPC pour commencer (les centres de recherche consomment énormément de bandes), Hammerspace s’est rapproché de trois partenaires à savoir Grau Data, Point Software et QStar Technologies parmi les 10 fournisseurs actifs dans ce secteur. Molly Presley, vice-présidente marketing chez Hammerspace, nous a précisé que « Hammersapce travaille actuellement avec des éditeurs spécialisés qui assurent une interface S3 entre la bande et Hammerspace, ce qui constitue notre premier pas vers la prise en charge des bandes dans notre environnement de données global ».
Le support de la bande arrive dans GDE grâce à des partenariats noués avec Grau Data, Point Software et QStar Technologies.
Parmi les clients de Hammerspace figurent Blue Origin de Jeff Bezos, la National Science Foundation et le Royal Caribbean Group, ainsi que des groupes de média. Les résultats commerciaux sont désormais visibles avec des clusters déployés et un chiffre d'affaires qui décolle. L'équipe compte aujourd'hui environ 120 personnes et se développe rapidement.