Cloudera l'avait annoncé début février, c'est au tour de l'éditeur MapR d'ajouter à sa distribution Hadoop le moteur Apache Spark, en couvrant l'ensemble de ses composants, dans le cadre d'un partenariat avec Databricks. Développé à l'Université de Berkeley (Californie), le framework Spark permet d'écrire des applications en Java, Scala ou Python et d'accélérer le traitement d'importants volumes de données en mémoire (jusqu'à 100 fois plus vite qu'avec MapReduce, assurent ses promoteurs) dans les environnements Hadoop. Il combine l'utilisation de Shark pour l'utilisation de SQL, MLlib pour l'apprentissage machine GraphX et la capacité de Spark à construire des applications en streaming.
MapR fournit un support 24/24 et 7/7 sur les projets Spark et rappelle qu'il fournit des livraisons mensuelles pour les projets Open Source Apache, permettant aux clients de mettre à jour les composants de sa distribution sans devoir mettre à jour le cluster entier. Â