La forte capacité d’apprentissage du système permet de prédire les collisions et les interactions entre des objets physiques. Il est possible d’apprendre aux ordinateurs à comprendre un grand nombre de choses sur le monde. Mais, quant à prédire ce qui peut se passer quand deux objets entrent en collision, rien ne remplace l’expérience. C’est là qu’intervient Galileo.
Développé par le laboratoire d’informatique et d'intelligence artificielle, le Computer Science and Artificial Intelligence Lab, du MIT (CSAIL), le nouveau modèle informatique a montré qu’il pouvait égaler l’homme pour prédire la façon dont les objets du monde réel pouvaient se déplacer et interagir entre eux. Si bien qu’il pourrait un jour aider des robots à prévoir des événements dans des situations de catastrophe et éviter à l'homme d’être blessé.
Un moteur de physique 3D au coeur du processus d'apprentissage
Dès les premiers jours de sa vie, l’être humain apprend, souvent à ses dépens - il se cogne, tombe - comment interagissent les objets physiques. Mais les ordinateurs ne peuvent pas compter sur cette formation précoce. C’est pour pallier ce manque que les chercheurs du CSAIL ont créé Galileo : d’une part, le système peut apprendre de façon autonome en regardant des vidéos sur le monde réel et, grâce à un moteur de physique 3D, il peut aussi apprendre à déduire les propriétés physiques des objets et prédire l’évolution de différents événements physiques.
Pour former Galileo, les chercheurs ont utilisé 150 vidéos d’événements physiques impliquant des objets fabriqués avec 15 matériaux différents, dont le carton, la mousse, le métal et le caoutchouc. Grâce à ces données, Galileo s’est fabriqué une banque de modèles d’objets avec leurs propriétés physiques. Ces informations ont été ensuite confiées à Bullet, un moteur physique 3D qui sert souvent dans le cinéma et les jeux vidéos pour créer des effets spéciaux. « En prenant les éléments clés d'une scène donnée, et en faisant des simulations physiques dans le temps, Bullet a, en quelque sorte, confronté les hypothèses de Galileo à la réalité », a expliqué le MIT. C’est sur cette base que les chercheurs ont développé des algorithmes d’apprentissage évolués qui permettent au modèle d’améliorer lui-même ses prévisions.
Une extension à des scénarios plus complexes
Pour tester les capacités de prédiction de Galileo, l'équipe a confronté son système « intelligent » à des sujets humains en leur présentant différents types de simulations (une démo de ces tests est disponible en ligne). Par exemple, les chercheurs ont montré aux participants la collision provoquée par un objet dévalant un plan incliné à 20 degrés. Ils leur ont ensuite montré la première image d'une vidéo où le plan est incliné à 10 degrés.
Les participants devaient dire si l'objet pouvait glisser ou non. « Il est intéressant de remarquer que le modèle informatique et les sujets humains ont répondu au hasard et que tous ont privilégié comme réponse le déplacement de l’objet », a déclaré Ilker Yildirim, auteur principal, avec le doctorant du CSAIL Jiajun Wu, d’un article décrivant la recherche. « Cela implique non seulement que les humains et les ordinateurs font des erreurs similaires, mais le test apporte la preuve supplémentaire que la compréhension d’une situation par un être humain peut être mieux décrite sous forme de simulation probabiliste ». L’article a été présenté le mois dernier lors de la Conference on Neuronal information Processing Systems qui s’est tenue à Montréal, comme l’a annoncé le MIT en début de semaine.
Les chercheurs du Lab aimeraient étendre leur travail à des scénarios plus complexes, et lui trouver des applications en robotique et en intelligence artificielle. « Imaginez un robot capable de s'adapter à une situation de catastrophe extrême comme une tornade ou un tremblement de terre ! », a déclaré le coauteur Joseph Lim. « Notre objectif ultime est de créer des modèles flexibles qui peuvent aider les humains dans des situations de forte incertitude ».