Un groupe d'auteurs a déposé un recours collectif contre OpenAI et Microsoft pour avoir prétendument enfreint leurs droits d'auteur en entraînant le chatbot d'IA ChatGPT sur leurs œuvres écrites et leurs revues académiques sans leur consentement. Cette plainte, l'une des nombreuses déposées contre le fournisseur de plateformes d'IA, intervient alors qu'OpenAI met fin à une période tumultueuse de cinq jours avec la réintégration de Sam Altman au poste de directeur général d'OpenAI. Son retour a été encouragé par les employés, les investisseurs et les alliés qui ont pris sa défense après son éviction par le conseil d'administration de l’entreprise la semaine dernière. Julian Sancton, auteur du best-seller du New York Times « Madhouse at the End of the Earth : The Belgica's Journey Into the Dark Antarctic », est le principal plaignant cité dans le procès, accusant OpenAI et Microsoft d'ignorer de manière flagrante les lois sur le droit d'auteur pour leur propre profit financier.
« OpenAI et Microsoft ont bâti une entreprise évaluée à des dizaines de milliards de dollars en s'appropriant sans autorisation les œuvres de l'humanité », affirme la plainte déposée par le cabinet d'avocats Susman Godfrey LLP. « Plutôt que de payer pour la propriété intellectuelle, ils font comme si les lois protégeant le droit d'auteur n'existaient pas ». Comme base de l'infraction, la plainte cite les années de conception, de recherche et d'écriture consacrées par les auteurs à leurs œuvres qu'OpenAI utilise sans leur autorisation. Julian Sancton, par exemple, a passé cinq ans et dépensé des dizaines de milliers de dollars à voyager dans le monde entier pour mener à bien les recherches nécessaires à la rédaction de son best-seller, selon plainte.
La loi Copyright Act censée protéger contre ces risques
Entre-temps, son best-seller a été intégré à un ensemble de données utilisées pour former ChatGPT, et des extraits de ce livre ainsi qu'un « corpus massif de documents protégés par le droit d'auteur » ont été reproduits sans autorisation ni compensation, toujours selon l'action en justice. « En entraînant leurs modèles, les défendeurs ont reproduit des documents protégés par le droit d'auteur afin d'exploiter précisément ce que la loi Copyright Act sur le droit d'auteur est censée protéger : les éléments d'expression qu'ils contiennent, tels que le style, le choix des mots, l'arrangement et la présentation des faits », indique encore la plainte.
« En outre, alors qu'OpenAI vaut « une fortune », ni OpenAI ni Microsoft ne versent de compensation aux auteurs pour leur propriété intellectuelle », affirment les plaignants, si bien que base de la plateforme OpenAI repose sur « rien de moins que le vol rampant d'œuvres protégées par le droit d'auteur », selon la plainte. Les plaignants demandent des dommages-intérêts et une restitution, ainsi que l'obligation pour les défendeurs de s'abstenir définitivement de porter atteinte à leurs droits. Ni Microsoft ni OpenAI n'ont immédiatement répondu à des demandes de commentaires distinctes.
Des affaires qui font jurisprudence
Cette action en justice n'est pas la première à remettre en cause l'utilisation de données protégées par le droit d'auteur dans ChatGPT et dans d'autres plateformes basées sur OpenAI. Toutefois, jusqu'à présent, aucun juge n'a donné gain de cause aux artistes ou aux créateurs, bien qu'ils aient ouvert la voie à cette possibilité. Le procès est également l'un des rares à citer Microsoft comme défendeur aux côtés d'OpenAI. Microsoft a investi des milliards de dollars dans OpenAI, la technologie qui alimente son robot Bing Chat ; en retour, OpenAI utilise exclusivement Microsoft comme partenaire « cloud ». En même temps, les deux entreprises sont concurrentes - OpenAI concédant des licences d'utilisation de sa technologie à d'autres - sans compter qu'elles se livrent depuis une semaine à une lutte acharnée pour le poste de CEO.
Dans un autre recours collectif intenté contre les fournisseurs de services d'images générées par Stability AI, Midjourney et DevianArt, un juge de district américain a estimé qu'il n'était « pas vraisemblable » pour l'instant de déterminer si les images générées pouvaient constituer une violation directe de la législation sur le droit d'auteur. Toutefois, le juge, en réponse à une motion de non-lieu déposée par les fournisseurs de services d'images, a autorisé les plaignants à modifier leur argumentation sur la manière dont les entreprises ont violé les lois sur le droit d'auteur, ouvrant ainsi potentiellement la voie à une victoire future pour ceux qui revendiquent une violation du droit d'auteur.
Un autre recours collectif a remis en cause la légalité de l'assistant de codage Copilot de GitHub, piloté par l'intelligence artificielle, parce que celle-ci a été entraînée sur les dépôts publics de GitHub. Les créateurs qui ont publié du code sous licence open source sur GitHub affirment que cette technologie viole leurs droits. Une décision est en attente dans cette affaire, dont la plainte a été déposée auprès d'un tribunal de district américain à San Francisco au nom de millions de codeurs potentiels. Si l'on en croit les commentaires postés sur X, anciennement Twitter, l'opinion publique est également divisée sur la question de savoir si les poursuites pour violation du droit d'auteur sont valables à une époque où la technologie, en particulier l'intelligence artificielle, évolue si rapidement. Un tweet de l'utilisateur X « Mike » (@OneGodel) a suggéré que les personnes qui pensent que le droit d'auteur devrait être maintenu à la lumière des progrès de l'IA « vivent dans l'âge des ténèbres », ce à quoi l'utilisateur Cutesy Carrot (@Carrot_breath) a répondu : « Si vous aviez déjà fabriqué quelque chose de valeur, vous sauriez que le droit d'auteur est une bonne chose ».