Alors que l’on trouve de plus en plus d’algorithmes d'apprentissage machine dans l'informatique grand public, le MIT, l’Institut de technologie du Massachusetts, prépare une solution qui facilitera l’usage de la technique pour la programmation ordinaire. Appelé Picture, ce langage de programmation dit probabiliste pourrait radicalement réduire la quantité de code nécessaire à un ordinateur pour reconnaitre un objet dans des images ou de la vidéo ou servir à programmer des tâches complexes avec un minimum de code. Lors d’un test avec ce langage, les chercheurs ont réussi à supprimer des milliers de lignes de code dans un programme de reconnaissance d'image, estimant à 50 % le gain par rapport à un codage normal. Ils devraient présenter leurs résultats lors de la conférence Computer Vision and Pattern Recognition (CVPR 2015) qui se tiendra à Boston du 7 au 12 juin.
« La programmation probabiliste nous permet de construire par exemple des modèles de visage les plus courants, et de les utiliser pour identifier assez justement un visage vu pour la première fois », a déclaré Josh Tenenbaum, un professeur en informatique cognitive au MIT qui a contribué aux travaux. L’image utilise une inférence statistique qui permet de faire l’économie d’une grande partie du travail de calcul réalisé par un ordinateur pour « voir ». Picture fonctionne un peu à l’envers de l'animation sur ordinateur. Les logiciels graphiques, comme ceux utilisés par Pixar et d'autres productions de films d'animation, représentent en deux dimensions des objets en trois dimensions, de façon à réduire le nombre d'instructions. Le langage Picture fonctionne dans l’autre sens, c’est-à-dire qu’il peut reconnaître un objet dans une image bidimensionnelle en la comparant à un ensemble d’objets possibles.
Une avancée permise grâce au calcul cloud
Ces travaux découlent d'un programme lancé en 2013 par l'Agence américaine Defense Advanced Research Projects Agency (la célèbre Darpa) pour développer des langages de programmation probabilistes facilitant l'utilisation de l'apprentissage automatique. Ce domaine de recherches est actif depuis des décennies, mais l’usage des technologies d’apprentissage machine devient de plus en plus commercialement envisageable, d’une part, parce que les ordinateurs sont plus puissants, mais aussi grâce à de nouveaux services d'apprentissage machine dans le cloud comme ceux proposés par IBM Watson, Amazon Web Services et Microsoft Azure.
« Même si la programmation probabiliste ne repose pas sur un moteur d'apprentissage machine, elle peut permettre de rationaliser l'utilisation de l'apprentissage automatique », a déclaré le professeur Tenenbaum. « Dans l'apprentissage machine au sens strict, la simple collecte de données de plus en plus nombreuses peut se traduire par des gains en performance, puisque c’est l'apprentissage machine lui-même qui fait le travail », a-t-il expliqué. « Dans la programmation probabiliste », le système sous-jacent est davantage basé sur la connaissance. « Il utilise un processus de causalité qui permet de savoir comment les images sont formées », a-t-il ajouté. Picture n’est que l’un des nombreux langages de programmation probabilistes sur lequel travaille le MIT aujourd’hui. « Les chercheurs de l’Institut travaillent notamment sur un langage appelé Venture, qui pourrait servir à des applications plus générales pour résoudre d'autres types de problèmes », a déclaré Josh Tenenbaum.
Commentaire