Nul doute que plus d'un patron de presse a dû croire à une hallucination d'IA générative ce 14 décembre. Prenant à contrepied la plupart des médias, un des plus grands groupes de presse mondiaux, Axel Springer, a en effet annoncé ce jour-là un accord avec OpenAI. Mais pas n'importe quel accord. Le géant allemand des médias a tout simplement décidé de donner à l'éditeur de ChatGPT accès au contenu de ses titres (Politico, Business Insider, Bild, die Welt, etc.) Moyennant un versement annuel de plusieurs dizaines de millions d'euros, selon le Financial Times, OpenAI puisera dans les archives, mais aussi et surtout dans les articles et images d'actualité du groupe de presse. Pour entraîner le LLM, bien sûr, mais principalement pour alimenter les réponses aux requêtes des internautes liées à l'actualité chaude. Les utilisateurs de ChatGPT recevront ainsi des réponses synthétiques bases sur les publications du groupe allemand.
Une stratégie surprenante, à l'heure où de plus en plus de médias dans le monde interdisent désormais à l'IA générative californienne d'exploiter leurs articles pour entraîner son modèle, sans référence à la source, ni contrepartie financière. « Cette réaction est d'autant plus compréhensible que les éditeurs de LLM agissent ainsi depuis des années, avec l'ambition d'en tirer profit, rappelle Olivier Martinez, fondateur de 255Hex.ai, société de conseil en IA générative, en particulier pour les médias. Ils doivent comprendre qu'on ne peut pas entraîner son modèle sur du contenu créé par d'autres, sans contrepartie. »
Un accord bénéfique aux deux parties
« C'est un très bon accord pour Axel Springer, poursuit-il, d'autant que c'est le premier du genre. Et pour les médias, il y a plusieurs enjeux, car l'intermédiation entre eux et l'utilisateur change. Depuis une vingtaine d'années, elle passe par Google et les médias sociaux. Mais cette fois, pour la première fois, on parle d'assistants en langage naturel. Ces derniers deviennent enfin l'interface homme-machine privilégiée. » Néanmoins, ce type d'accord ne sera pas donné à tout le monde. Le groupe Axel Springer possède des titres puissants en Allemagne, mais surtout avec un rayonnement international important, essentiel pour des éditeurs de LLM comme OpenAI. Bild est le 11e site payant avec le plus grand nombre d'abonnés, et Die Welt le 31e (*).
Du côté d'OpenAI, plusieurs enjeux justifient la démarche. « Cet été, ils avaient déjà signé un accord avec l'agence de presse AP, rappelle Olivier Martinez. Un engagement qui ne concernait cependant que les archives de l'agence de presse. Tous les acteurs du monde des LLM s'aperçoivent que la qualité doit primer sur la quantité en matière d'entraînement. Y compris pour des raisons de coûts. GPT-4 a coûté une fortune à développer et à entraîner. » Pour augmenter l'efficacité de la solution à un coût moindre, OpenAI cherche donc à disposer de contenu plus vertical, plus ciblé, comme celui du groupe Axel Springer. L'éditeur de ChatGPT « a aussi tout intérêt à ce genre d'accord, car il lui permet de sourcer officiellement ses réponses, poursuit Olivier Martinez. On ne devrait d'ailleurs pas parler de moteur de recherche, mais de moteur de réponse. »
Pas question de remplacer ceux qui créent le contenu
Pour lui, la démarche du Californien est en effet également révélatrice d'un tournant dans les usages. Les LLM ont pour objectif de travailler sur la synthèse, la réécriture de textes. Mais, dès la sortie de ChatGPT, ses utilisateurs s'en sont servi comme d'un moteur de recherche. « Ce que cherche OpenAI avec Axel Springer, c'est aussi une capacité de réponse à des requêtes sur l'actualité chaude. » Cette stratégie pourrait directement ou indirectement cibler Google. D'autant que si le groupe de presse allemand alimente le moteur californien en contenu récent et payant, celui-ci sera probablement priorisé dans les réponses. Un autre modèle familier chez le premier des Gafa. Depuis l'été, Google teste d'ailleurs SGE (Search generative experience), un moteur de réponse alimenté par l'IA générative. A chaque requête, celui-ci présente une réponse directe et non une liste de liens. (Le géant de Mountain View présente déjà le contenu de Wikipédia en réponse aux requêtes simples, depuis plusieurs années).
« Les médias peuvent aussi tirer une leçon positive de cet accord, conclut Olivier Martinez. C'est la preuve symbolique qu'Open AI ne veut pas produire de contenu, ni remplacer ceux qui en créent. Il ne s'agit pas de remplacer les journalistes, car on a besoin d'information de qualité. Et c'est également vrai pour les LLM ! »
(*) Selon une enquête FIPP / Celeraone de 2021 citée dans Visual Capitalist, le tabloïd Bild (494 000 abonnements) s'arrogeait la 11e place du classement des sites de média payants, quand Die Welt se classait en 32e place (132 000). Mi-2023, le paywall Poool qui a mis à jour ces chiffres donnait la 10e place à Bild et la 31e au Welt.
Le mariage d'Axel Springer avec OpenAI prend à contrepied les médias
Le 14 décembre, le groupe de presse allemand Axel Springer a annoncé, à la surprise générale, un accord avec OpenAI, qui donne à ce dernier l'accès au contenu de toutes ses publications. Une stratégie à contrepied de bon nombre d'autres médias qui pourrait néanmoins se révéler gagnante.