Jusqu'à présent, le terme « art IA » signifiait « images statiques ». Plus maintenant. Meta présente Make-A-Video, où l'entreprise combine l'IA et l'interpolation pour créer des GIF vidéo courts et en boucle. Make-A-Video.studio n'est pas encore disponible pour le public. Au lieu de cela, il est montré comme ce que Meta elle-même peut faire avec la technologie. Et oui, bien qu'il s'agisse techniquement d'une vidéo - dans le sens où il y a plus que quelques images générées par l'IA assemblées - c'est probablement plus proche d'un GIF traditionnel qu'autre chose.
Mais peu importe. Ce que Make-A-Video accomplit est triple, d'après la démonstration faite sur le site de Meta. Tout d'abord, la technologie peut prendre deux images liées - qu'il s'agisse d'une goutte d'eau en vol ou de photos d'un cheval au galop - et créer les images intermédiaires. Plus impressionnant encore, Make-A-Video semble être capable de prendre une image fixe et d'y appliquer un mouvement de manière intelligente, en prenant l'image fixe d'un bateau, par exemple, et en créant une courte vidéo de son déplacement sur les vagues. Enfin, le service peut assembler le tout. À partir de l'invite « un ours en peluche qui peint un portrait », Meta a montré un petit GIF d'un ours en peluche animé qui se peint lui-même. Cela montre non seulement la capacité à créer de l'IA, mais aussi à en déduire une action, comme l'indique le document de recherche de la société.
« Un chien portant une tenue de super-héros avec une cape rouge volant dans le ciel », de MetaAI. (Crédit : Meta)
L’algorithme entraîné sur des vidéos réelles capturées ?
« La recherche Make-A-Video s'appuie sur les récents progrès réalisés dans la technologie de génération de texte à image construite pour permettre la génération de texte à vidéo », explique la firme. « Le système utilise des images avec des descriptions pour apprendre à quoi ressemble le monde et comment il est souvent décrit. Il utilise également des vidéos non taguées pour apprendre comment le monde bouge. Grâce à ces données, Make-A-Video vous permet de donner vie à votre imagination en générant des vidéos fantaisistes et uniques en leur genre avec seulement quelques mots ou lignes de texte ».
Cela signifie probablement que Meta entraîne l'algorithme sur des vidéos réelles qu'il a capturées. Ce qui n'est pas clair, c'est la manière dont cette vidéo est saisie. Le document de recherche de Facebook sur le sujet n'indique pas comment la vidéo pourrait être obtenue à l'avenir, et l'on peut se demander si la vidéo anonymisée capturée sur le réseau social pourrait être utilisée comme semence pour l'art futur.
Meta affirme qu'il peut interpoler une vidéo à partir de deux images connexes. Les deux images de gauche servent de base à créer une vidéo (capturée à droite). (Crédit : Meta)
Ce n'est pas entièrement nouveau, du moins sur le plan conceptuel. Des animations comme VQGAN+clip Turbo peuvent prendre un texte et le transformer en une vidéo animée, mais le travail de Meta semble plus sophistiqué. Il est toutefois difficile de se prononcer tant que le modèle n'est pas mis à la disposition du public pour qu'il puisse jouer avec. Néanmoins, la création via l'IA entre ainsi dans une autre dimension : celle du mouvement.
Commentaire