Dans le cadre de ses recherches sur une IA responsable, Intel a développé FakeCatcher, une technologie capable de détecter les fausses vidéos avec un taux de précision de 96 %. Il s’agit du premier détecteur de deepfake en temps réel qui renvoie des résultats en quelques millisecondes. Dans un contexte d’augmentation des vidéos classées comme truquées, leur diffusion représente une menace croissante. Ce terme fait référence non seulement au contenu ainsi créé, mais aussi aux technologies utilisées. Est considéré comme deepfake un enregistrement vidéo ou audio réalisé ou modifié grâce à l'intelligence artificielle. Selon Gartner, les entreprises dépenseront jusqu'à 188 milliards de dollars en solutions de cybersécurité. Ces fausses vidéos peuvent s’avérer difficiles à détecter en temps réel et il est parfois nécessaire de les télécharger pour analyse, puis d'attendre des heures pour obtenir des résultats.
Durant ce laps de temps, qui peut paraître très court pour certains, la vidéo peut toutefois se propager à une vitesse folle et induire en erreur ceux qui la regardent, au point de causer des dommages et entraîner des conséquences négatives, comme une perte de confiance dans les médias. Intel mise sur FakeCatcher pour rétablir cette confiance et aider les utilisateurs à faire la distinction entre le vrai et le faux contenu. Ilke Demir, chercheuse principale chez Intel Labs et travaillant sur le sujet ajoute : « Les vidéos deepfake sont partout maintenant. Vous les avez probablement déjà vus ; des vidéos de célébrités faisant ou disant des choses qu'elles n'ont jamais réellement faites ».
Une orchestration d’outils pour détecter
Concrètement, la détection de deepfakes en temps réel d'Intel repose sur du matériel et des logiciels Intel et s'exécute sur un serveur et des interfaces via une plateforme Web. Côté logiciel, un orchestre d'outils spécialisés forme l'architecture FakeCatcher optimisée. Intel précise que les équipes ont utilisé OpenVino pour exécuter des modèles d'IA sur les algorithmes de détection de visages et de points de repère. Les blocs de vision par ordinateur ont été optimisés avec son outil interne Integrated Performance Primitives (une bibliothèque logicielle multithread) et OpenCV (une boîte à outils pour le traitement d'images et de vidéos en temps réel), tandis que « les blocs d'inférence ont été optimisés avec Deep Learning Boost et avec Advanced Vector Extensions 512, et les blocs multimédias ont été optimisés avec Advanced Vector Extensions 2 » précise la firme. Les équipes se sont également appuyées sur le projet Open Visual Cloud pour fournir une pile logicielle intégrée pour la famille de processeurs Xeon Scalable. Côté matériel, la plateforme de détection en temps réel peut exécuter simultanément jusqu'à 72 flux de détection différents sur des processeurs Xeon Scalable de 3e génération.
La plupart des détecteurs basés sur le deep learning examinent les données brutes pour essayer de trouver des signes d'inauthenticité et d'identifier ce qui ne va pas avec une vidéo. FakeCatcher recherche plutôt des indices authentiques dans de vraies vidéos, en évaluant ce qui fait de chacun d’entre nous des êtres humains. Le détecteur se sert ainsi des signaux de flux sanguin collectés sur tout le visage et des algorithmes traduisant ces signaux en cartes spatio-temporelles. Ensuite, grâce au deep learning, FakeCatcher détecte instantanément si une vidéo est réelle ou fausse.
Un outil de lutte contre la désinformation
A l’avenir, les plateformes de médias sociaux pourraient tirer parti de la technologie pour empêcher des utilisateurs de télécharger des vidéos deepfake nuisibles. Les agences de presse pourraient également utiliser le détecteur pour éviter d'amplifier par inadvertance des vidéos manipulées.