Pour accélérer la création de modèles de deep learning et leur intégration dans les applications, Amazon vient de constituer un jeu d’outils open source pour l’apprentissage machine automatisé, qu'il livre en open source avec l'objectif de faciliter la tâche des développeurs. Amazon présente AutoGluon comme un service s'adressant à la fois aux experts en machine learning et à ceux qui débutent dans ce domaine, en leur permettant d’intégrer dans leurs développements des fonctions prédictives performantes. Le kit a été officiellement lancé le 9 janvier. Il permet d’exploiter des modèles d’apprentissage machine avec image, texte, jeux de données de structure tabulaire, sans recourir à une expérimentation manuelle. Par exemple, pour reconnaître le ou les sujets principaux d’une image, pour faire des prédictions à partir du contenu d’un texte ou pour prédire les valeurs dans les colonnes d’une table à partir des valeurs des autres colonnes.
Accessible sur le site du projet ou sur GitHub, AutoGluon automatise un certain nombre de décisions pour les développeurs, ce qui permet de produire un modèle de réseau neuronal avec seulement trois lignes de code. Autre intérêt mis en avant par Amazon, son service tire parti des ressources de calcul disponibles pour trouver le modèle le plus puissant compte-tenu du runtime alloué. Il s’utilise avec Python 3.6 ou 3.7 et il est pour l’instant limité à Linux. Les supports de Windows et MacOS sont prévus ultérieurement.
Optimisation hyperparamétrique
En résumé, les capacités d’AutoGluon, telles qu’elles sont présentées, permettent de prototyper des solutions de deep learning pour un jeu de données avec peu de lignes de code. Le service met en oeuvre l’optimisation hyperparamétrique - consistant à choisir les paramètres optimaux pour contrôler le processus d’apprentissage - ainsi que la sélection du modèle, la recherche de l’architecture et le traitement des données. Il peut aussi servir à améliorer les modèles de réseaux neuronaux existants et les pipelines de données. Enfin, il s’appuie sur les API pour améliorer les performances prédictives dans les applications sans faire intervenir d’expertise humaine.
Habituellement, le déploiement de modèles de deep learning qui requiert une grande précision d’inférence nécessite l’intervention d’un expert et l’entraînement de ces modèles exige des développeurs beaucoup de temps et d’efforts. Malgré les avancées apportées par certains outils, tels que la bibliothèque Keras, pour spécifier plus facilement les paramètres et les couches dans ces modèles, les développeurs continuent à se débattre avec des problèmes complexes en particulier sur le pré-traitement des données et l’optimisation hyperparamétrique. Avec AutoGluon, Amazon prétend rendre le deep learning plus accessible à davantage de développeurs.
Commentaire