Dans le match entre les droits de propriété intellectuelle et l’intelligence artificielle, les décisions de justice sont scrutées pour savoir de quel côté va pencher la balance. Un juge américain vient de donner une première victoire aux ayants droits en statuant en faveur de Thomson Reuters dans une affaire d’entraînement d’une IA. La plainte date de 2020 contre Ross Intelligence, une start-up en IA dans le domaine juridique. Il lui est reproché de s’être servie sans autorisation de la plateforme de recherche juridique de Thomson Reuters nommée Westlaw pour entraîner son modèle d’IA. Il est à noter que Westlaw indexe de grandes quantités de documents non protégés par le droit d’auteur (jugement, actes juridiques,...), mais les mélange avec son propre contenu protégé (annotations, analyses,...).
Pour sa défense, Ross Intelligence a fait valoir que l’entraînement d’une IA devait être identifié comme une pratique soumise au « faire use » ou usage équitable. Cette doctrine accorde dans certains cas le droit de réutiliser du contenu protégé par des droits d’auteur. Elle a été mise en avant dans certains procès comme celui d’Oracle sur les API Java dans Android. Les magistrats regardent attentivement plusieurs critères pour l’accepter : la raison de l'œuvre, la nature de l'œuvre (poésie, fiction, lettres privées, etc.), la quantité d'œuvres protégées par le droit d'auteur utilisées et son impact sur la valeur marchande de l'œuvre originale.
Une première alerte sur l’inapplication du fair use pour l’IA
En l’espèce, le juge a estimé que l’utilisation par la start-up du contenu protégé affectait sa valeur originale, car elle avait l’intention de développer un concurrent direct. Un porte-parole de Thomson Reuters s’est satisfait de la décision du tribunal fédéral américain auprès de nos confrères de Wired, « le contenu éditorial de Westlaw, créé et mis à jour par nos avocats rédacteurs, est protégé par le droit d'auteur et ne peut être utilisé sans notre consentement ». De son côté, Ross Intelligence a fermé ses portes en 2021 face aux coûts de la procédure judiciaire.
Cette décision est donc une première alerte pour d’autres sociétés qui ont développé des modèles d’IA. Elle pourrait faire jurisprudence dans d’autres affaires concernant l’usage abusif de contenus protégés pour entraîner les LLM. La plupart des éditeurs aujourd’hui ne communiquent pas sur leur dataset de fondation en sachant que probablement il contient du contenu soumis à des droits d’auteur. Il faudra voir dans les prochaines décisions quelle sera l’approche des juges du principe de « l’usage loyal » dans l’IA. Avec à la clé des demandes d’indemnisation qui pourraient être particulièrement élevées.
Commentaire