Profitant de re:Invent 2022, Amazon Web Services a ajouté mercredi des capacités supplémentaires à son service d'apprentissage automatique géré SageMaker, conçues pour améliorer les attributs de gouvernance au sein du service et ajouter des capacités supplémentaires à ses notebooks. Dans le contexte d'Amazon SageMaker, les notebooks sont des instances de calcul qui exécutent l'application Jupyter Notebook. Selon AWS, ces améliorations permettront aux entreprises d'étendre la gouvernance à l'ensemble du cycle de vie de leurs modèles de machine learning (ML). À mesure que le nombre de modèles de ML augmente, il peut devenir difficile pour les entreprises de gérer la tâche consistant à définir des contrôles d'accès à privilèges et à établir des processus de gouvernance pour documenter les informations sur les modèles, telles que les ensembles de données d'entrée, les informations sur l'environnement d'entrainement, la description de l'utilisation du modèle et l'évaluation des risques.
Les équipes d'ingénierie des données et d'apprentissage automatique utilisent actuellement des feuilles de calcul ou des listes ad hoc pour naviguer dans les politiques d'accès nécessaires à tous les processus concernés. Cela peut devenir complexe à mesure que la taille des équipes d'apprentissage automatique augmente au sein d'une entreprise, a indiqué AWS dans un communiqué. Un autre défi consiste à surveiller les modèles déployés pour détecter les biais et s'assurer qu'ils fonctionnent comme prévu, a indiqué l'entreprise.
Role Manager et Model Cards viennent booster SageMaker
Pour relever ces défis, la firme a ajouté Role Manager afin de faciliter le contrôle d'accès et la définition des autorisations pour les utilisateurs par les administrateurs. Grâce à cet outil, les administrateurs peuvent sélectionner et modifier des modèles préétablis en fonction des différents rôles et responsabilités des utilisateurs. L'outil crée ensuite automatiquement des politiques d'accès avec les permissions nécessaires en quelques minutes, a déclaré la société. AWS a également ajouté un second outil à SageMaker, appelé Model Cards, pour aider les équipes de datascientist à abandonner la tenue manuelle des dossiers.
L'outil fournit un emplacement unique pour stocker les informations sur les modèles dans la console AWS et il peut remplir automatiquement les détails de l'entraînement comme les ensembles de données d'entrée, l'environnement de formation et les résultats de la formation directement dans Amazon SageMaker Model Cards, a déclaré la société. « Les praticiens peuvent également inclure des informations supplémentaires à l'aide d'un questionnaire auto-guidé pour documenter les informations du modèle (par exemple, les objectifs de performance, l'évaluation des risques), les résultats de la formation et de l'évaluation (par exemple, les mesures de biais ou de précision), et les observations pour référence future afin d'améliorer encore la gouvernance et de soutenir l'utilisation responsable du ML », a déclaré le fournisseur de services cloud.
Un tableau de bord dédié
En outre, la société a ajouté Model Dashboard pour fournir une interface unique dans SageMaker pour suivre les modèles d'apprentissage automatique. À partir du tableau de bord, les entreprises peuvent également utiliser les intégrations intégrées avec SageMaker Model Monitor (capacité de surveillance de la dérive des modèles et des données) et SageMaker Clarify (capacité de détection des biais ML), a déclaré la société, ajoutant que la visibilité de bout en bout aidera à rationaliser la gouvernance de l'apprentissage automatique.
Le Notebook de SageMaker Studio monte en gamme
Outre l'ajout de fonctions de gouvernance à SageMaker, AWS a apporté des améliorations à Studio Notebook pour aider les équipes data sciences à collaborer et à préparer les données plus rapidement au sein du notebook. Une fonctionnalité de préparation des données dans SageMaker Studio Notebook aidera désormais les équipes de science des données à identifier les erreurs dans les ensembles de données et à les corriger depuis l'intérieur du notebook. Cette fonctionnalité permet aux data scientists d'examiner visuellement les caractéristiques des données et de remédier aux problèmes de qualité des données, a déclaré la société, ajoutant que l'outil génère automatiquement des graphiques pour aider les utilisateurs à identifier les problèmes de qualité des données et suggère des transformations de données pour aider à résoudre les problèmes courants.
Pour rappel, AWS a lancé SageMaker Studio en 2019, qu’elle décrit comme « le premier environnement de développement (IDE) entièrement intégré pour la science des données et l'apprentissage automatique (ML) ». Cet IDE donne accès à des Notebooks Jupyter entièrement gérés qui s'intègrent à des outils spécialement conçus pour effectuer toutes les étapes de ML, de la préparation des données à la formation et au débogage des modèles, au suivi des expériences, ou encore au déploiement et à la surveillance des modèles et à la gestion des pipelines. « Une fois que le praticien a sélectionné une transformation de données, SageMaker Studio Notebook génère le code correspondant dans le notebook afin qu'il puisse être appliqué de manière répétée à chaque fois que le notebook est exécuté », a déclaré la société.
Afin de faciliter la collaboration entre les équipes de datascientist, AWS introduit également un espace de travail au sein de SageMaker où les experts peuvent lire, modifier et exécuter des notebooks ensemble en temps réel, a indiqué la société. Parmi les autres fonctionnalités de SageMaker Studio Notebook, citons la conversion automatique du code des notebooks en tâches prêtes pour la production et la validation automatisée des modèles de ML à l'aide de demandes d'inférence en temps réel. En outre, le fournisseur a déclaré qu'il ajoutait des fonctionnalités géospatiales à SageMaker pour permettre aux entreprises d'accroître son utilisation ou son rôle dans la formation des modèles d'apprentissage automatique. L’objectif est de « simplifier le processus de création, de formation et de déploiement de modèles avec des données géospatiales ». Le service n’en est pour l’instant qu’à ses débuts, la prise en charge d'Amazon SageMaker pour le ML géospatial étant uniquement disponible en preview dans la région USA Ouest (Oregon).