Avec sa solution Miria conçue pour la sauvegarde des très grands volumes de données non structurées, Atempo a fortement développé son expertise sur la protection et la migration dans les environnements petascale et exascale, avec une capacité à prendre en charge des workflows complexes, sur site et dans le cloud. Sa technologie couvre de nombreux cas d’usage verticaux, notamment dans le secteur de la recherche, de la santé, du HPC, du divertissement et des médias. L’éditeur basé à Paris réalise la majorité de ses développements en France, a rappelé Hervé Collard, son vice-président marketing, lors d’un IT Press Tour virtuel consacré cet automne aux applications de stockage, de backup et d’archivage (*).
La solution Miria ne prend pas seulement en charge les grands volumes de données, elle est aussi conçue pour traiter un très grand nombre de fichiers, la gestion de plusieurs milliards de fichiers s’avérant particulièrement difficile, a de son côté souligné Louis-Frédéric Laszlo, directeur de la gestion produit d’Atempo. Au-dessus de son framework technique, l’éditeur français a développé une architecture de composants, les data movers, pour opérer backup, migration, archivage, déplacement et synchronisation de données avec des capacités de passage à l’échelle sur les gros volumes. Ce sont ces data movers, orchestrés par les serveurs d’Atempo, qui gèrent les mouvements de données entre les différents environnements de stockage sources et cibles, quels qu’ils soient : du NFS vers le stockage objet, des bandes vers le cloud, etc. « Nous pouvons travailler avec pratiquement toutes les technologies de stockage sur le marché et nous avons développé des partenariats forts avec les fournisseurs de cloud », rappelle Louis-Frédéric Laszlo. La solution Miria utilise iFS et NFS et elle est compatible avec des systèmes de fichiers scale-out comme Lustre, Panasas, StorNext et JPFS. « Tous les vendeurs de solutions de stockage qui sont compatibles S3 ou Swift sont compatibles avec Miria », a précisé M. Laszlo, en mentionnant également une intégration native avec les solutions de stockage sur bande off-line et le stockage Air-GAP. Pour les NAS, une couche d’abstraction, baptisée FastScan, a été développée au-dessus des API de différents fournisseurs de stockage en réseau. Elle aide à optimiser les opérations de scanning dans les très grands environnements où le temps passé à identifier les changements incrémentaux peut tourner au cauchemar. Même s’il n’y a que 2 ou 3 changements à synchroniser d’une source de stockage à une autre, le temps passé à les identifier avec un scanning classique est très long. Atempo insiste enfin sur sa prise en compte « by design » des aspects de sécurité, ceux-ci étant intégrés dès la phase de conception de Miria.
Assurer la continuité de la production
En 2021, Atempo a revisité l’interface utilisateur de Miria et étendu ses capacités de déploiement et ses compatibilités avec les offres de stockage existantes. Le fournisseur a également complétée sa solution de Snapstor, une fonctionnalité de gestion des workflows de backup qui permet d'accélérer la reprise d’activité après sinistre. « Les organisations qui génèrent de très importants volumes de données, dans la santé ou le HPC, par exemple, mettent en place la synchronisation, la réplication et les snapshots mais elles ne font plus de backup, ces solutions n'apportant pas l'efficacité demandée », a exposé M. Laszlo. Il décrit le cas du premier client d'Atempo équipé de SnapStor. Intervenant dans la recherche en génomique, ce client ne peut pas attendre un processus de restauration complet pour remettre en ligne son séquençage génomique. « Ils doivent avoir une solution de restauration proche de l’instantanée pour assurer une continuité de leur production », pointe M. Lazslo. Dans leur cas, si le stockage primaire n’est plus accessible, une opération complète de restauration, compte-tenu de la volumétrie gérée, peut prendre au moins trois semaines, ce qui est incompatible avec les contraintes opérationnelles d'une entreprise.
Avec SnapStor, à la fin de la sauvegarde, l’ensemble des permissions sont réappliquées sur le stockage cible où se trouve le référentiel de backup. « Nous copions et créons des exports NFS et CIFS sur le stockage secondaire et la cible est sécurisée par un instantané ». En cas d’incident, Snapstor permet alors de lancer la restauration sur une version antérieure pour une reprise d’activité rapide. Les utilisateurs accèdent directement aux données sauvegardées. Il n’est donc pas nécessaire d’attendre que le stockage primaire soit remis en service. Quand ce dernier est de nouveau accessible, Miria restaure et resynchronise les fichiers en fonction des priorités de l’activité. Dans certains cas, cela pourra prendre plusieurs semaines, mais dans l’intervalle, les utilisateurs auront pu continuer à accéder aux applications. Sur le stockage primaire, Snapstor supporte tous les NAS acceptés par Miria et pour héberger le référentiel de backup, la solution est compatible avec IBM GPFS et avec les solutions de Huawei, Dell et Qumulo. La liste doit se compléter dans les prochains mois.
Miria for Analytics guide les migrations de données
Au sein de sa R&D, Atempo a par ailleurs créé une entité consacrée au développement de fonctionnalités analytiques pour ses produits. Ces équipes viennent de sortir Mira for Analytics pour faciliter la gestion des grands volumes de données. Dans ces contextes, les principales difficultés consistent d’abord à localiser les données où qu'elles soient (sur disques, sur bande, dans le cloud, sur un stockage NAS…), puis à les identifier par leurs métadonnées ou leur contenu. Il s’agit ensuite de pouvoir réduire les silos de données en détectant les doublons, d'optimiser le stockage, d'améliorer les workflows de données, de suivre l’évolution des données dans le temps, de déterminer sur quel type de stockage les garder et pendant combien de temps, etc. La migration de données est l’un des domaines d’application important de Miria for Analytics dont le premier cas d’usage est l’évaluation des données, utilisée comme un outil de surveillance de l’activité au fil des semaines. « Si un client a, par exemple, 2 Po de données avec seulement 0,5 % de changements, cela n’impactera pas la migration de la même façon que s’il n’a que 500 To mais avec 50% de changements. Cette activité de monitoring va donc aider à anticiper l’infrastructure de migration et à planifier le transfert », explique Damien Mesgard, responsable produit analytique chez Atempo.
Miria for Analytics utilise un agent pour parcourir le système de fichiers en interrogeant les silos de données, online et offline, pour découvrir les fichiers et en générer des empreintes. Un référentiel de métadonnées est constitué : chemins vers les volumes, dates, tailles des objets, propriétaire… Cet agent de découverte s’utilise sur les disques et les principaux NAS sans limite de taille, il supporte les systèmes de fichiers Lustre-GPFDS et StorNext. Miria for Analytics Essential est disponible depuis l’automne et Atempo a prévu de livrer une version plus avancée, Miria for Analytics Augmented, en avril 2022.
2000 clients dans le monde
Très bien implanté en Europe où il pousse des solutions de stockage souveraines, Atempo compte au total plus de 2000 clients dans le monde. Atempo développe aussi les solutions Lina, pour assurer une protection continue des données sur les terminaux, et Tina, pour gérer la sauvegarde des données et des applications sur les serveurs physiques et virtuels. Le fournisseur français développe aussi son offre Atempo for MSP, destinée aux fournisseurs de services managés.
(*) L'IT Press Tour virtuel consacré au stockage cet automne a également fait intervenir Quantum, qui monte d'un cran dans le stockage objet, Ixsystems avec son offre hyperconvergente TrueNAS Scale, la start-up néozélandaise Nexustorage dont la solution combine les modes fichier, bloc et objet, Spectra Logic, un spécialiste du stockage sur bande, Fungible, qui dope le stockage NVMe/TCP avec ses DPU, ou encore Auristor qui vient concurrencer les services en ligne avec sa plateforme AFS.