Ceux qui souhaitent essayer Hadoop, mais qui n'ont pas à disposition un ou deux clusters, peuvent maintenant tester la plateforme d'analyse de données sur leur ordinateur, grâce à la distribution Hortonworks Sandbox. Cette dernière est une application d'un noeud simple Hadoop, basée sur la Data Platform de Hortonworks. Intégrée dans une machine virtuelle, elle comprend plusieurs composants que l'on trouve dans un déploiement Hadoop, y compris le sous-système de gestion du stockage HCatalog, Hive pour le datawarehouse et Pig, un ensemble d'outils d'analyse de données.
Cette offre propose aussi un certain nombre de tutoriels qui montrent aux utilisateurs comment analyser les données avec Hadoop, selon Cheryle Custer, directrice marketing de Hortonworks. Le package comprend trois tutoriels et d'autres seront mis à disposition dans les mois à venir. Des vidéos et mêmes des jeux en ligne sont disponibles pour tester des fonctionnalités.
Bien que largement utilisé, Hadoop peut représenter un défi pour les utilisateurs, comme les data scientists. En effet, ce logiciel nécessite un énorme travail d'intégration et d'exécution. En plus de l'installation de la distribution et d'une JVM (Java Virtual Machine), l'utilisateur doit également mettre en place un système de fichiers. Sans compter que Hadoop nécessite un compte utilisateur, ce qui pourrait poser un risque de sécurité. Hortonworks Sandbox élimine ce travail d'installation. L'utilisateur n'a besoin que de télécharger l'application et d'exécuter une VM. Cette instance élaborée sur la distribution Linux de CentOS fonctionnera sous deux environnements, VMware et Oracle Virtual Box.
En parallèle du lancement de cette application, Hortonworks a publié la semaine dernière la version 1.2 de Data Platform avec des améliorations en matière de gestion et de sécurité.
Hortonworks Sandbox simplifie l'apprentissage de Hadoop
L'apprentissage de la mise en place de Hadoop au sein d'une entreprise peut se révéler compliqué. Hortonworks lance l'offre Sandbox qui comprend plusieurs outils, des tutoriels et une installation simplifiée de la solution de traitement des grands volumes de données.