Hasard du calendrier, l'étape parisienne du CTO Roadshow de Teradata, fin juin, a coïncidé avec l'annonce, par le fournisseur américain, de son portefeuille d'offres pour Hadoop. Celui-ci est constitué de quatre solutions : deux appliances Teradata (dont l'une, hybride, exploite Aster Database), une offre réalisée avec Dell, fournie par le constructeur texan (Commodity Offering for Hadoop) et une version uniquement logicielle. Sur la mise en oeuvre d'Hadoop, Teradata avait initialement noué un partenariat avec Cloudera, qu'il poursuit. Mais cette fois, le portefeuille annoncé repose sur Hortonworks Data Platform (HDP). « Nous travaillons beaucoup avec Hortonworks en ce moment qui, comme nous, a un important département R&D (*). Par ailleurs, ils sont engagés à 100% dans une distribution Open Source de Hadoop et travaillent avec leurs partenaires de la même façon que nous pour créer de la valeur ajoutée sur l'intégration. Notre SQL-H Interface, qui utilise une extension à la syntaxe SQL et que nous développons avec eux, en est un bon exemple », a commenté lors d'un entretien à Paris Martin Willcox, directeur marketing plateforme et solutions chez Teradata pour l'international.

D'autres fournisseurs de base de données approchent Hadoop différemment, rappelle-t-il. « Mais il y a un point d'intégration primaire qui exploite le standard de métadonnées HCatalog et qui est supporté par Hortonworks. L'intégration est ainsi plus facile à mettre en place et fournit de meilleures performances, on peut par exemple faire du partitionnement avancé. Et nous pouvons le faire avec Hortonworks parce qu'ils ont la même vision d'Hadoop que nous. D'autres travaillent avec les metadonnées mais ils créent des logiciels propriétaires qu'ils ne reversent pas dans l'Open Source », pointe Martin Willcox.

Un réel risque de fragmenter Hadoop

Teradata veut faire sortir Hadoop de la Silicon Valley pour le faire adopter plus largement, affirme le directeur marketing. « Nous pensons qu'il y a beaucoup d'organisations qui sont intéressées par Hadoop mais qui sont bloquées parce qu'elles ne disposent pas des bonnes compétences pour l'installer et qu'elles ne savent pas comment la technologie va s'insérer dans leur architecture. Nous avons deux objectifs : apporter cette expertise aux clients pour qu'ils puissent déployer de façon appropriée, et aussi créer des logiciels à valeur ajoutée autour de cet environnement ». En cela, Martin Willcox marque la différence de Teradata avec d'autres fournisseurs qui créent leurs distributions d'Hadoop. Il cite en exemple IBM ou EMC Pivotal. « Ce n'est pas notre approche, nous pensons qu'il y a un réel risque qu'Hadoop devienne un peu comme Unix dans les années 80/90, fragmenté... Que l'on trouve de nombreuses versions suffisamment différentes pour créer des problèmes d'intégration, mais pas assez différentes pour apporter une valeur particulière les unes par rapport aux autres. Nous voulons donc qu'Hadoop reste Open Source et créer du logiciel qui l'étende plutôt que le rendre propriétaire », pointe le directeur marketing. « Hortonworks partage notre vision ».

Ce qui n'empêchera pas Teradata de faire d'autres annonces avec Cloudera, probablement dans le courant de cette année. Sa stratégie ayant toujours reposé sur le « best of breed ». Les clients qui ont installé ses solutions ou celles d'Aster (racheté en 2011) ont investi dans d'autres logiciels aussi. « Nous ne leur demandons pas de tout jeter pour travailler avec nous et avons toujours eu des partenariats avec les principaux éditeurs d'outils de BI, d'ETL, de logiciels de CEP (traitement d'événements complexes) et de bus d'entreprises. « Et, bien sûr, nous voulons collaborer avec les principaux distributeurs d'Hadoop ».

Une appliance de production et des solutions de test

Au sein du portefeuille de produits s'appuyant sur la distribution de Hortonworks, l'Appliance for Hadoop, équipée du logiciel SQL-H (HDP 1.1), est positionnée sur le marché existant de Teradata, précise Martin Willcox. Ce système prêt à l'emploi intègre matériel et logiciels de gestion, d'administration et de haute disponibilité (*). Il est logé dans une armoire de 204,5 x 61 x 124,4 cm (830 kg une fois installé), dispose de 152 To de stockage non compressé par armoire (le système peut être porté au total à 10 Po) et exploite, sous Linux Suse 11, deux doubles processeurs Core Xeon Intel, l'un de huit coeurs, l'autre six (pour le serveur de données). Une liaison InfiniBand à 40 Gb/s assure les échanges entre les systèmes Teradata, Aster et Hadoop. Côté logiciels, il intègre aussi HCatalog, plusieurs outils Open Source et des solutions partenaires, celles d'Informatica, de Revelytix, de Protegrity.

[[page]] 

Cette appliance est conçue pour apporter à nos clients ce dont ils bénéficient avec nos systèmes intégrés, souligne Martin Willcox. « Les noeuds du cluster Hadoop ne sont pas construits sur du matériel standard et ils sont reliés dans ce que nous appelons la Virtual infrastructure qui détecte les pannes avant qu'elles ne se produisent. » Pour les clients qui déploieront l'appliance avec leurs systèmes Teradata en production, cette valeur ajoutée est très importante, pointe-t-il. En revanche, pour les entreprises qui veulent seulement expérimenter Hadoop, la haute disponibilité et la fiabilité sont des considérations moins cruciales. Ce peut être, par exemple, une banque qui arrête son système de service automatique par téléphone et souhaite vérifier si elle peut tirer quelque chose des informations recueillies pour réduire le coût d'acquisition des clients. « Dans ces cas-là, nous proposons l'offre construite avec Dell ou la version purement logicielle que le client installera sur le matériel de son choix, à un coût moindre », explique Martin Willcox. « Nous avons toujours eu une approche par famille de produits », rappelle-t-il.

Aster Big Analytics, livrée avec 70 fonctions analytiques

Quant à l'appliance Aster Big Analytics, conçue pour les applications analytiques, elle avait déjà été annoncée en octobre 2012. Il s'agit d'une offre construite à la suite du rachat par Teradata de la société Aster Data Systems il y a deux ans. Elle présente une architecture hybride qui intègre Aster Database, Aster SQL-MapReduce et Apache Hadoop (HDP 1.1). Sa configuration matérielle est semblable à celle d'Appliance for Hadoop (armoire intégrée de 204,5 x 61 x 124,4 cm, processeurs Xeon, liens Infiniband, 152 To pour Hadoop et 88 To pour Aster).

Les analystes métiers peuvent lancer des requêtes SQL, via SQL-H et SQL-Map Reduce, à la fois sur les données gérées dans la base Aster et sur les données Hadoop. L'appliance Aster Big Analytics est livrée avec une bibliothèque de plus de 70 fonctions analytiques prêts à l'emploi pour le marketing, l'analyse de comportement ou de texte, notamment.

(*) En 2012, Teradata a dépensé 169 M$ en R&D, soit environ 6,3% de son chiffre d'affaires (2,67 milliards de dollars) et 45 M$ au 1er trimestre 2013, soit 7,6% du CA.

(**) Pour Teradata, Viewpoint, TVI (gestion), Hadoop Builder, Intelligent start/stop, DataNode swap, deferred drive replace (administration), NameNode HA, Master Machine Failover (haute disponibilité). Pour Hortonworks, HBase, Apache Ambari, Hive, Nagios, Mahout.