Pour les éditeurs ayant investi le champ des projets big data, la conférence Strata + Hadoop World 2015 (à New York du 29 septembre au 1 octobre) constitue un bon tremplin pour présenter leurs dernières évolutions. Ainsi, Continuum Analytics, connu pour les capacités d’analyse d’Anaconda, sa distribution de Python, vient de dévoiler une offre destinée aux entreprises. Il propose sous la forme d’une pile - présentée comme facile à déployer - un ensemble de briques pour permettre aux équipes de data scientists et de développeurs d’explorer et résoudre des problèmes complexes autour des données.
Anaconda inclut plusieurs centaines d’outils pour le traitement des données volumineuses, l’analyse prédictive, le calcul scientifique, etc. Désormais, la distribution est proposée dans une version gratuite sous licence BSD, tandis que sa version payante est déclinée en trois abonnements : Pro, Workgroup et Enterprise, pour un prix démarrant à 10 000 dollars par an jusqu’à 10 utilisateurs.
Intégration avec Spark
Continuum Analytics met en avant l’intégration GPU et multicoeur de sa distribution. Il pointe aussi la présence d’un framework qui « isole l’organisation des changements faits en back-end et permet d’écrire les requêtes une fois pour les déployer partout. » Ces capacités facilitent la collaboration sur des projets sophistiqués. Par rapport à la version gratuite, qui inclut les optimisations MKL, les packages R et les mises à jour des packages Open Source Jupyter, pandas, scik itlearn (etc.), les versions payantes apportent l’exploration et la visualisation, le partage des notebooks (environnement pour échanger du code) et l’intégration avec Spark et Hadoop.
Parallèlement, Anaconda Cloud, fournit à la communauté créée autour du logiciel un portail web gratuit pour le partage des notebooks et des environnements reproductibles, ainsi qu’un téléchargement pour le prototypage de cluster destiné à des traitements analytiques taillés pour le big data.
Teradata veut mettre du DevOps dans le datawarehouse
En restant dans le monde du langage développé par Guido van Rossum il y a 24 ans, Teradata a lancé de son côté son « Module for Python », avec lequel il veut étendre les pratiques DevOps à l’environnement du datawarehouse. Le module permet aux développeurs et aux data scientists d’utiliser le langage Python pour créer des applications exploitant les données des bases. Elles s’exécuteront sur un serveur d’application avec envoi des requêtes SQL vers la base Teradata, ou bien s’exécuteront directement au sein de cette dernière. L’éditeur dit avoir développé ce module en tirant parti des pratiques DevOps apprises avec ses propres développements de produits et ceux de ses utilisateurs.