Microsoft a ajouté plusieurs nouveautés à son offre Azure ML pour l'apprentissage machine, notamment une meilleure intégration avec Python et des fonctions d'auto-optimisation automatisées pour accélérer le développement des modèles. Du fait de sa grande accessibilité, de son importante bibliothèque d'apprentissage machine et de ses nombreux outils de support, Python est le langage incontournable de l'apprentissage machine. L'offre d'Azure avec Python consiste en un nouveau SDK qui permet à Azure ML de se connecter à l'environnement Python existant d'un développeur. Ce SDK est livré avec le paquet azureml-sdk installable en utilisant le gestionnaire de paquets pip de Python. La plupart des environnements Python, aussi bien l’installation Python générique que les distributions spécifiques aux sciences des données comme Anaconda Python, ou encore comme l’application web Jupyter Notebook, peuvent se connecter à Azure ML de cette façon.
Parmi les utilitaires apportés par le SDK, on trouve des outils pour la préparation des données, pour l'enregistrement des résultats des expériences, la sauvegarde et la récupération des données d'expériences à partir du stockage Blob d'Azure, des outils pour la distribution automatique de modèles entraînés sur plusieurs nœuds et la création automatique de divers environnements d'exécution de tâches, comme des VM distantes, des conteneurs Docker et des environnements Anaconda.
Un zeste de Python dans Azure ML
Autre nouvelle fonctionnalité d'Azure ML supportée par le nouveau Python SDK : l'apprentissage machine automatisé. Le concept sous-jacent n'est pas nouveau : il s'agit d'une forme d'optimisation hyperparamétrique, c’est-à-dire un moyen d'ajuster automatiquement les paramètres utilisés pour un système d'apprentissage machine particulier afin d'obtenir de meilleurs résultats. L’éditeur le qualifie de « système de recommandation pour les pipelines d'apprentissage machine ». « De la même manière que les services de streaming recommandent des films aux utilisateurs, l'apprentissage machine automatisé recommande des pipelines d'apprentissage machine pour les ensembles de données ». La firme affirme également que l'automatisation peut se faire sans voir les données sensibles, ce qui préserve ainsi la vie privée des utilisateurs.
Parmi les autres fonctionnalités d’Azure ML, on peut citer :
- Le deep learning distribué : il permet aux modèles d'être entrainés automatiquement sur un cluster de machines sans avoir à configurer le cluster.
- L'inférence accélérée par matériel : elle utilise les FPGA pour accélérer l'exécution des inférences à partir des modèles.
- La gestion des modèles via CI/CD : elle permet d’utiliser les conteneurs Docker pour gérer les modèles entrainés.
Commentaire