Microsoft a installé Apache Hadoop sur son cloud public Azure, ainsi qu'il l'avait annoncé en octobre dernier sur PASS Summit 2011. Dans le cadre de la mise à jour de son service de cloud, l'éditeur vient de mettre à disposition une pré-version de cette plateforme d'analyse de données Open Source, souvent utilisée pour traiter les big data. Selon lui, celle-ci permet de déployer des applications Hadoop en quelques heures. Par ailleurs, les développeurs, qui disposent depuis septembre du SDK Windows Azure 1.5, se voient maintenant proposer, au-delà des outils .Net et Visual Studio, un kit de développement pour le framework JavaScript Node.JS (hébergés sur Github).
Avec cette mise à jour du service, Microsoft indique aussi simplifier les montées en charge. D'une part, parce que la taille maximum de la base de données SQL Azure se trouve multipliée par trois (150 Go contre 50 Go auparavant) pour le même prix, soit 500 dollars. D'autre part, en raison de l'arrivée de SQL Azure Federation avec lequel on peut découper des bases SQL Server de différentes tailles pour les faire migrer vers Azure SQL. Microsoft souligne la réduction au Go qui résulte de ces modifications et s'élève à 67% pour la plus grande base, ramenant le prix du Go à 3,33 dollars (mise à jour : 354,25 € pour 150 Go, soit 2,36 € par Go). Pour chaque Go transféré depuis ou vers Azure, les clients américains et européens vont payer 0,12 dollar, contre 0,15 dollar précédemment.
Analyser dans Hadoop Hive à partir de PowerPivot
Pour les utilisateurs de la plateforme Azure, le processus d'enregistrement a été facilité. En définissant des quotas d'usage, le service peut être testé gratuitement pendant 90 jours. L'utilisation et le détail des dépenses se consultent directement sur le portail d'administration Windows Azure. Microsoft dit par ailleurs avoir simplifié sa facturation avec une date de facturation unique pour les clients ayant plusieurs abonnements et une vue synthétique des factures.
En octobre, Microsoft avait annoncé qu'il s'appuierait sur la distribution d'Hadoop proposée par Hortonworks, société issue des rangs de Yahoo. De nouvelles bibliothèques JavaScript aideront les développeurs à construire des tâches MapReduce, ainsi que des pilotes pour analyser les données dans la base Hadoop Hive, à partir du tableur Excel et de son add-on PowerPivot.
Microsoft n'a pas précisé quand le service Hadoop serait disponible dans sa version complète. Pour utiliser l'actuelle pré-version, il faut s'enregistrer. A partir de ces inscriptions, Microsoft va sélectionner un certain nombre d'utilisateurs pour tester la plateforme, sur la base de modèles d'usage qu'il prévoit.
Eclipse, MongDB, Solr/Lucene et Memcached
Avec la bibliothèque Node.js, les développeurs pourront créer des applications web qui fonctionneront sur une version Azure de SQL Server. Pour assister l'utilisation du framework, Microsoft propose un SDK incluant une copie de Node.js, une version de Windows PowerShell et un émulateur Azure. Les développeurs peuvent construire et tester leurs applications sur leurs propres machines, puis les charger sur Azure afin de les y déployer.
Microsoft procure également des outils et de la documentation pour intégrer dans Azure d'autres environnements ou briques Open Source, parmi lesquelles l'IDE (integrated developer environment) Eclipse, la base de données MongoDB, le moteur de recherche Lucene/Solr et la technologie de cache en mémoire distribuée Memcached. Le support de toutes ces technologies va permettre aux développeurs de « bâtir des applications sur Windows Azure en utilisant les langages et frameworks qu'ils connaissent déjà », note dans un billet Gianugo Rabellino, directeur des communautés Open Source chez Microsoft.
Microsoft héberge Hadoop dans Azure
Outre la disponibilité d'une pré-version limitée d'Apache Hadoop sur son cloud Azure, Microsoft a triplé la taille de la base de données SQL Azure accessible aux utilisateurs, pour un prix identique. L'éditeur propose aussi un SDK pour Node.js et de nouvelles bibliothèques JavaScript.