Des chercheurs de Google Brain qui travaillent dans le domaine du deep learning, l’un des champs de l’apprentissage machine, ont trouvé comment apprendre à des réseaux de neurones à chiffrer leurs propres messages pour communiquer de façon confidentielle. Fin octobre, Martin Abadi et David Andersen ont présenté leurs travaux dans un article publié sur arxiv.org : « Learning to protect communications with adversarial neural cryptography ». Les deux chercheurs expliquent qu’ils ont cherché à savoir si les réseaux de neurones pouvaient utiliser des clés secrètes pour protéger leurs informations vis-à-vis d'autres réseaux neuronaux. L’objectif de leur recherche était de mettre en place - au sein d’un système multi-agents - un échange confidentiel entre deux d’entre eux, baptisés Alice et Bob et de déterminer s’il leur était possible d’empêcher un troisième réseau neuronal, Eve, d’espionner cet échange.

« Nous n’avons pas imposé d’algorithmes de chiffrement spécifique à ces réseaux neuronaux. Au lieu de cela, nous avons mis en place un apprentissage de bout en bout, de façon contradictoire », expliquent-ils dans leur article. « Nous avons démontré que les réseaux neuronaux pouvaient apprendre à réaliser certaines formes de chiffrement et de déchiffrement, et aussi comment appliquer ces opérations de manière sélective pour atteindre des objectifs de confidentialité ».

Un système multi-agents communiquant

Dans le scénario décrit par les chercheurs, la propriété de sécurité souhaitée est bien la confidentialité et non l’intégrité. L’adversaire Eve est un « attaquant passif » qui peut intercepter des communications mais qui par ailleurs est assez limité. Il ne peut pas engager de sessions, ni injecter de messages, pas plus qu’il ne peut modifier les messages en transit.

Alice et Bob veulent communiquer clairement, mais sans qu’Eve les comprenne. Plutôt que d’entraîner Alice et Bob séparément à mettre en place certains systèmes de chiffrement connus, les chercheurs les ont entraîné conjointement à communiquer ensemble. Alice construit ses messages en utilisant un algorithme secret que Bob doit découvrir, tandis qu’Eve essaie, sans succès, de lire le message envoyé. Dans leur article, les chercheurs démontrent que les réseaux neuronaux peuvent apprendre à protéger leurs communications. Cet apprentissage ne nécessite pas qu’on leur spécifie un ensemble particuliers d’algorithmes de chiffrement, ni qu’on leur indique des façons d’appliquer ces algorithmes, expliquent les auteurs. « Il se base uniquement sur la spécification de confidentialité qui est représentée dans les objectifs d’apprentissage. »

Martin Abadi et David Andersen expliquent qu’au bout d’un certain temps, Alice et Bob ont commencé à communiquer efficacement, mais d’une façon qui permettait à Eve d’améliorer aussi, graduellement, sa compréhension. Puis, vers l’étape 10 000, Alice et Bob ont contré les progrès d’Eve et autour de l’étape 15 000, les objectifs ont été atteints. Les étapes suivantes ont seulement permis à Eve de faire de légers progrès. Dans ce contexte, les attaquants ont été modélisés par réseaux neuronaux ; des modèles alternatifs peuvent peut-être être mis en œuvre avec un apprentissage renforcé, ont précisé les chercheurs.