Dell a annoncé pour début septembre des serveurs embarquant la solution Apache Hadoop de Cloudera, complétés de composantes réseaux, d'outils d'administration, de services et de support pour en assister le déploiement. Avec cette offre, le constructeur vise les secteurs des services financiers, de l'énergie et des télécoms, de la distribution de détail, des médias et de l'Internet, ainsi que les organismes de recherche. En combinant logiciel et matériel optimisé pour l'offre Open Source Hadoop, Dell cherche à proposer un coût de possession moins élevé que certaines offres propriétaires pour mettre en oeuvre les applications analysant d'importants volumes de données (complexes et évoluant de façon dynamique).
L'offre repose sur la ligne de serveurs PowerEdge C, modèles C2100, C6100 ou C6105, conçus pour être utilisée dans les projets de traitement à grande échelle, notamment par leur taille et leur consommation électrique réduite. Elle intègre la distribution Hadoop de Cloudera (CDH), ainsi que sa suite d'outils d'administration. Pour gérer la mise en place, elle inclut le logiciel Crowbar, de Dell. Côté équipements réseaux, l'offre comprend un jeu de commutateurs PowerConnect 6248 Gigabit Ethernet à 48 ports. Un déploiement reposant sur cette architecture peut aller de 6 à 720 noeuds.
« Cette offre est une réponse directe à ce que nous entendons de la part de nos clients », a expliqué Joseph George, directeur du marketing cloud chez Dell. Selon lui, une part importante d'entre eux envisagent l'utilisation d'Hadoop ou y ont déjà recours. « Cela devient un standard de facto », ajoute-t-il en expliquant que Dell a placé une architecture de référence au-dessus d'un serveur adapté à cet environnement.
Le coût démarre à 118 000 dollars
Créé par Doug Cutting, un spécialiste des technologies de recherche, Apache Hadoop est monté en puissance au sein des entreprises devant passer au crible d'énormes quantités de données non structurées, telles que les connexions aux serveurs. Outre Hadoop, l'offre CDH de Cloudera regroupe différents composants, parmi lesquels l'infrastructure de datawarehouse Hive, Pig (langage de programmation MapReduce), la structure de stockage de données HBase, les bibliothèques Whirr pour exploiter des services cloud, ou encore Zookeeper, Flume, Hue, Oozie et Sqoop. Les serveurs peuvent être installés sous différents systèmes versions de Linux, Red Hat Enterprise Linux 5.6 ou 6, CentOS, Ubuntu ou Suse.
Le coût d'une configuration minimum démarre entre 118 000 dollars et 124 000 dollars suivant les options de support retenues. Cela inclut un an au support de Cloudera et les mises à jour. Ce package est similaire à celui que Dell a annoncé fin juillet pour son offre de cloud privé reposant sur OpenStack, Michael Dell, PDG de Dell, ayant confirmé son intention de proposer davantage de solutions complètes intégrant matériel, logiciels et support. Ce faisant, le fournisseur renforce aussi ses offres s'appuyant sur des composantes Open Source.
Illustration : les composants de CDH, la distribution de Cloudera incluant Apache Hadoop (source : Cloudera)
Dell embarque l'offre Hadoop de Cloudera dans ses serveurs PowerEdge C
Peu de temps après avoir présenté une troisième plateforme de cloud privé reposant sur OpenStack, Dell a annoncé pour septembre une autre solution s'appuyant sur une brique Open Source. Celle-ci combine à ses serveurs la distribution Hadoop de Cloudera et des équipements réseaux pour les applications d'analyse appliquées aux données volumineuses.