MapR, société américaine, qui édite une des trois principales distributions Hadoop avec Cloudera et Hortonworks, vient d'ouvrir une filiale en France. A la tête de ce bureau, on retrouve deux personnes connues dans le monde du stockage, Xavier Guerin, auparavant chez Isilon Systems et Quantum, comme vice-président en charge de l'Europe du Sud et du Benelux, et Aurélien Goujet, auparavant chez Isilon Systems, comme directeur technique Europe du Sud et du Benelux. « La première ambition est de nous faire connaître, car le marché du big data est très fragmenté. La seconde est de fédérer cet écosystème autour de MapR », souligne Xavier Guérin. Le responsable a des arguments pour cela. En premier lieu, la distribution est orientée entreprise, « elle n'est pas réservée qu'au grand acteur comme Google, Linkedin ou Facebook », précise Aurélien Goujet.

Simplicité et des déploiements à venir


Les deux responsables mettent en avant la simplicité du système de fichier NFS proposé par MapR, une technologie qui a nécessité deux ans de travail. « Le HDFS de Hadoop est complexe, car les fichiers doivent être proches des CPU et le process a tendance à dupliquer les fichiers », expose Aurélien Goujet. La solution de MapR passe par de la compression de fichiers.  La distribution Hadoop dispose aussi de fonctionnalités de snapshot pour la sécurisation en miroir des données.

Souvent marqué comme limite de Hadoop, la gestion des requêtes SQL est dans la roadmap de MapR. « Des développements sont en cours avec le projet Drill au sein de la fondation Apache dont une première version arrive en juin », révèle Aurélien Goujet. Il existe un projet concurrent, Impala, soutenu par Cloudera, pour l'analyse en temps réel des données contenues dans HDFS.

Un réseau à créer


Au-delà de la technique, les responsables de MapR en France vont construire un réseau de partenaires. « Nous sommes en train de finaliser des accords avec des intégrateurs dans le domaine du stockage et une première formation aura lieu fin juin pour leur assurer une plus grande autonomie », explique Xavier Guérin. Le dirigeant s'appuiera aussi sur les éditeurs comme Tableau Software qui utilise cette brique pour la visualisation ou comme accélérateur de la donnée.

Il ajoute que HP, Cisco et EMC sont aussi des revendeurs de l'offre. Sur la partie clientèle, l'évangélisation sur les bénéfices du traitement big data va se poursuivre et s'accentuer avec le recrutement de commerciaux. Les cibles vont des banques aux assurances en passant par les industriels, mais aussi les sites web pour scruter les comportements des internautes.