Un an après l’acquisition de Revolution Analytics et de ses logiciels basés sur le langage open source R, Microsoft dévoile sa propre plateforme d'analyse des big data reposant sur cet outil d’analyse statistique, de plus en plus utilisé parmi les data scientists. La solution fonctionne sous Windows, Red Hat Enterprise Linux (5.x et 6.x) ou Suse Linux. Elle est également proposée avec Hadoop pour RHEL 6.x (au choix entre Cloudera, Hortonworks et MapR), ainsi qu’avec Teradata DB. Toutes ces versions sont disponibles sur MSDN, ainsi qu’à travers le programme DreamSpark par lequel Microsoft propose gratuitement des logiciels pour la formation et la recherche dans l’enseignement technique.
L’offre est baptisée R Server, quoique dans sa version Windows, MSDN la fournit toujours sous le nom de RRE, le produit de Revolution Analytics sur lequel elle semble s’appuyer. Pour toutes ces versions, R Open, la distribution R de Microsoft, est un prérequis. L’éditeur de Redmond n’a pas communiqué de détails supplémentaires pour l'instant.
Modélisation prédictive et apprentissage machine
Revolution R Enterprise (RRE) avait fait son apparition sur le cloud Azure en septembre dernier et le mois suivant, le support de R avait été ajouté à une préversion de la base de données SQL Server 2016. Aujourd’hui, la nouvelle plateforme R Server supporte différentes capacités de statistiques associées aux big data, de modélisation prédictive et d’apprentissage machine. Toutes sont compatibles avec le langage de programmation R, souligne dans un billet Lee Stott, évangéliste technique pour Microsoft UK. Les utilisateurs peuvent faire tourner des scripts dans une architecture parallèle haute performance pour explorer, modéliser et faire des analyses prédictives à grande échelle, indique-t-il.
R est devenu très populaire dans le monde de l’analytique. Avec le rachat de Revolution, Microsoft a cherché à renforcer ses propres capacités avancées dans ce domaine, constate Nik Rouda, analyste senior du cabinet Enterprise Strategy Group. Il rappelle qu’il n’est pas trivial de réaliser des analyses avancées dans SQL. Pour lui, Microsoft cherche donc à faire de R son point d’entrée dans ce domaine et R Server était logiquement l’étape suivante dans cette stratégie.
« R tient un peu de Cobol » pour certains développeurs
La technologie d’apprentissage machine de l’éditeur peut utiliser le langage de statistiques pour la préparation des données, ajoute Mike Gualtieri, analyste de Forrester Research. « C’est une bonne orientation pour Microsoft, mais je devine qu’ils ne vont pas mettre tous leurs œufs data science dans le même panier R », pointe-t-il. « Je sais que ce langage est très répandu parmi les spécialistes des données, mais je pense que la plupart des informaticiens ne le considéreraient pas comme un langage très élégant, efficace ni performant pour quelque usage que ce soit », estime-t-il. Pour les développeurs engagés sur des projets complexes, « R tient un peu de Cobol » selon lui.