En direct de Bruxelles. En phase ascendante, l'intérêt manifesté en Europe autour d'Hadoop se reflète dans la fréquentation du salon organisé par Hortonworks et Yahoo à Bruxelles (15-16 avril). Uniquement centré sur le framework Open Source et les projets associés, Hadoop Summit Europe 2015 est bien sûr moins couru que le récent Big Data Paris (6 500 visiteurs) à la couverture plus large, mais il approche cette année les 1 300 visiteurs (800 l'an dernier) et 33 exposants dont, toujours, Cloudera et MapR, concurrents directs d'Hortonworks sur les distributions Hadoop. L'édition de San José, du 9 au 11 juin, attend de son côté plus de 4 000 participants et 100 exposants. Le contenu des sessions est élaboré avec la communauté Hadoop, rappelle Herb Cunitz, président d'Hortonworks.
Parmi les chantiers du moment, l'initiative Open Data Platform (ODP), annoncée en février par une quinzaine de fournisseurs IT, vise à constituer un socle commun sur les composants coeur du framework Open Source, pour accélérer son adoption, développer plus rapidement l’écosystème périphérique et prévenir les risques de fragmentation. Une première harmonisation vient d’être faite autour des plateformes Hadoop de Hortonworks, IBM et Pivotal, soit moins de 60 jours après l’annonce de l’alliance, a souligné Shaun Connolly, responsable de la stratégie d’Hortonworks. A Bruxelles, les trois fournisseurs ont annoncé que leurs produits respectifs, HDP 2.2, Open Platform 4.0 et Pivotal HD 3.0, étaient alignés sur un socle ODP basé sur Apache Hadoop 2.6, incluant le gestionnaire de fichiers HDFS, le négociateur de ressources Yarn et MapReduce, auquel s’ajoute également la console de gestion des clusters Ambari qui a récemment enrichi ses fonctionnalités de monitoring. « Avec ODP, les ISV et autres partenaires pourront être certifiés autour d’une version cohérente, ce sera plus simple pour eux, alors que l’existence de différentes versions sème plutôt la confusion », a pointé Shaun Connolly, responsable de la stratégie d’Hortonworks.
Les membres d’ODP gardent plusieurs fers au feu
Aujourd’hui, l’initiative regroupe 16 partenaires et n’inclut pas les deux autres flambeaux des distributions Hadoop, Cloudera et MapR, qui ont développé et commercialisent des modules propriétaires, alors qu’Hortonworks s’en tient à la version Open Source autour de laquelle il vend son support. S’il est bien trop tôt pour toute conjecture, il est évident que son succès dépendra de ses avantages réels pour les entreprises et de l’intérêt concret qu’elles auront à s’appuyer sur ce socle. « ODP nous permettrait de sortir des produits plus vite et également de corriger des problèmes plus vite, mais nous continuons à travailler avec les autres distributions car SAS veut être présent partout », a notamment indiqué Mark Torr, responsable du centre d’excellence Analytical Platform pour SAS EMEA et AP, s’exprimant sur une table ronde organisée par Hortonworks. Il est certain que la plupart des acteurs, y compris ceux qui sont à l’initiative d’ODP comme SAS, vont continuer à développer leurs compétences sur les deux autres grandes distributions.
« ODP permettrait notamment aux clients de migrer d’une distribution à l’autre », a avancé de son côté Martin Wilcox, directeur international Big Data COE pour Teradata. « Hadoop n’est pas le seul composant dans les projets mais il est crucial, il faut faire en sorte que les clients tirent le plus de bénéfices possibles des investissements qu’ils y ont fait et les capacités d’intégration entre les différentes composantes est un élément très important ». Aiden O’Brien, responsable de l’initiative Big Data pour EMC, estime pour sa part qu’un socle stable est nécessaire.
Collaboration, compatibilité et interopérabilité
« Les entreprises ont besoin de coopération et de partenariat pour avancer plus vite et c’est ce que nous faisons avec ODP », a justifié Léo Spiegel, vice-président senior responsable de la stratégie de Pivotal. « Nous voyons ODP comme un moyen de collaborer autour d’un Hadoop non fragmenté : collaboration et compatibilité, ce sont vraiment les deux axes importants de la démarche », a confirmé Anjul Bhambhri, vice-présidente, chargée des big data et des flux chez IBM. Au lieu de travailler chacun sur sa version, les avancées de chacun sont mises en commun, ce qui permet de se concentrer sur une version plus fiable, plus concrète, a-t-elle exposé en soulignant l’avantage pour les ISV notamment de ne pas avoir à supporter plusieurs distributions et à tester des fonctionnalités complémentaires (analytiques, capacités géospatiales, machine learning…) sur chaque version d’Hadoop. D’autant qu’ODP promeut l’interopérabilité et que le framework de provisionning et de monitoring Ambari permettra de gérer les modules complémentaires d’autres vendeurs. « Par ailleurs, nous voyons Hadoop comme une partie de la gestion de données en entreprise autour de laquelle les vendeurs ajoutent de la valeur. L’objectif, c’est qu’il soit facile de combiner ces différentes capacités », estime-t-elle. IBM s’emploie par exemple à assurer un haut niveau de compatibilité dans son portefeuille de produits entre, notamment, SPSS, Cognos, BigInsights et ODP.
Pour Herb Cunitz, président d’Hortonworks, au-delà du nombre de fournisseurs qui rejoindront l’initiative et du nombre de projets mis en place, le critère qui permettra d’évaluer le succès d’ODP sera effectivement la facilité avec laquelle les entreprises pourront assembler les différentes briques autour d’Hadoop.