Avec en toile de fond la conférence Strata+Hadoop World qui se tient en ce moment à San José, Microsoft vient d'annoncer la disponibilité générale de deux de ses services cloud Azure axés sur l'analyse avancée de données. Il s'agit d'une part de Machine Learning, arrivé en préversion il y a huit mois, et d'autre part de Storm pour son service Hadoop HDInsight qui permet le traitement en temps réel de flux de big data. Ce 2ème service est en préversion depuis cinq mois.
L'éditeur de Redmond ouvre par ailleurs sur Azure une préversion de HDInsight sur Linux, sur des clusters Ubuntu, en plus de sa version pour Windows, et annonce l'arrivée sur sa Marketplace des outils d'intégration de données de son partenaire Informatica. La version Linux de HDInsight s'adresse en particulier aux entreprises qui ont déjà déployé sur site Hadoop sur Linux, par exemple via Hortonworks Data Platform. Elles pourront utiliser les outils Linux habituels pour gérer HDInsight et déployer des connexions hybrides vers Azure.
Des applications de Machine Learning en quelques heures
Proposé sous la forme d'un service cloud managé destiné aux analyses avancées, le service Machine Learning doit permettre aux entreprises de réduire les délais pour pouvoir exploiter les technologies d'apprentissage machine utilisées pour prédire des tendances futures dans différents domaines. C'est un sujet sur lequel Microsoft (et d'autres fournisseurs comme IBM) insiste beaucoup en ce moment. « En quelques heures, les développeurs et les data scientists pourront bâtir et déployer des apps pour améliorer l'expérience utilisateur, prévoir et éviter des pannes, améliorer l'efficacité opérationnelle » ou encore découvrir des informations dans différents domaines, énumèrent dans un billet T.K. Rengarajan, responsable Data Platform chez Microsoft, et Joseph Sirosh, reponsable de l'activité Machine Learning. « Il fallait auparavant des semaines ou des mois pour disposer de fonctionnalités analytiques aussi avancées qui demandaient d'investir des ressources considérables, tant en personnel qu'en logiciels et matériels pour gérer les big data », pointent-ils.
Le Machine Learning Studio utilise Python et R
A cela s'ajoute maintenant la possibilité de récupérer sur la Marketplace Machine Learning des API et des services que les développeurs pourront déployer rapidement (outils de recommandation, par exemple, ou de détection et de prédiction d'anomalies) sans être nécessairement data scientists, assurent T.K. Rengarajan et Joseph Sirosh en citant plusieurs clients exploitant déjà les bénéfices de ces services. Parmi eux, le fabricant d'ascenseurs ThyssenKrup les exploite pour la maintenance prédictive de ses installations et l'Université Carnegie Mellon pour réduire les dépenses d'énergie de ses immeubles.
L'environnement de développement associé au service, Machine Learning Studio, recourt à des langages Open Source comme Python, ou R, utilisé par les statisticiens. De nouveaux algorithmes sont par ailleurs disponibles, comme Learning with Counts pour travailler sur des teraoctets de données en utilisant des traitements parallèles dans HDInsight.
Storm pour HDInsight vise l'Internet des objets
Quant à Storm pour HDInsight, le 2ème service en disponibilité générale, il va permettre de traiter en temps réel des flux de données générés par les capteurs et les terminaux connectés. Il sera exploité pour l'Internet des objets. Selon Microsoft, il sera possible de bâtir en quelques clics des scénarios dans ce domaine. L'éditeur cite en exemple la société israélienne Linkury qui l'utilise pour ses services de monétisation en ligne des flux web. Les développeurs peuvent utiliser Storm à la fois avec .Net et Java, précise Microsoft et concevoir leurs applications temps réel directement dans Visual Studio.Â