Au fil des années, Google TensorFlow s’est assumée comme une suite d’outils open source efficaces pour le deep learning. Mais mettre en place des projet d’apprentissage avec cette solution peut encore s’avérer long et fastidieux, surtout quand il est nécessaire de récupérer des jeux de données déjà utilisées par quelqu’un d’autre et que tous le processus d'apprentissage doit être redéfini. Le nombre de variables nécessaires à la mise en place d’un modèle de deep learning a de quoi rebuter jusqu’aux meilleurs experts en la matière.
Cette semaine, le projet de Google a fait un pas vers la simplification de cette démarche grâce au lancement de Tensor2Tensor, ou T2T pour les intimes. Cette librairie de workflow basée sur le langage Python apporte aux développeurs un certain nombre d'éléments prédéfinis (modèles, jeux de données, paramètres) pour la mise en place de leur modèle d’apprentissage et simplifie la gestion de ces derniers grâce à plusieurs fonctionnalités.
T2T s’articule ainsi autour de cinq outils principaux. Le premier, Dataset, permet l’ajout des jeux de données, soit à un workflow dédié, soit directement à l’ensemble des processus d’apprentissage gérés par TensorFlow. Problems and Modabilities sert pour sa part à définir les objectifs du projet et ses applications, comme la reconnaissance vocale ou de photo. Il permet en outre de définir les types de résultats attendus, par exemple, si suite à une reconnaissance d’image, le processus doit donner un résultat sous forme de texte ou sous la forme d’une autre image.
T2T limité au contexte de TensorFlow
L'outil Models regroupe ensuite la plupart des processus déjà utilisés au sein de T2T et permet de les réutiliser tel quel, ou de les modifier pour les adapter à votre projet. Il est également possible d'en ajouter d'autres. Afin de gérer les différents paramètres et de contrôler la phase d’apprentissage, les utilisateurs pourront s’appuyer sur Hyperparameters. Et enfin, Trainers permet de réinjecter les paramètres précédemment spécifiés dans d’autres projets T2T.
Dès sa première utilisation, T2T est ainsi paramétré par défaut et peut donc être rapidement opérationnel. Un grand nombre de jeu de données et de modèles sont déjà embarqués par la librairie et peuvent être réutilisés ou modifier pour s’adapter à votre projet. Toutefois, la solution a aussi des limites. Elle ne permet pas, par exemple d’élargir le contexte de travail au-delà de l’univers TensorFlow. Elle ne fait que simplifier l’utilisation de ce dernier.
Commentaire