ChatGPT peut-il co-écrire votre étude ?  (Non, mais cela peut aider pour la recherche)

Maintenant, les tribunaux sont impliqués

Lorsque le romancier Douglas Preston a commencé à jouer avec ChatGPT, il a lancé un défi au logiciel d’IA : pourrait-il écrire un poème original basé sur un personnage de certains de ses livres ?

« Il est sorti avec ce formidable poème écrit en pentamètre iambique », se souvient Preston. Le résultat était impressionnant – et inquiétant. « Ce qui m’a vraiment surpris, c’est tout ce qu’il en savait sur ce personnage ; bien plus que ce qu’il aurait pu glaner sur Internet », a déclaré Preston.

L’écrivain d’aventures soupçonnait que le chatbot avait absorbé son travail d’une manière ou d’une autre, probablement dans le cadre du processus de formation par lequel un modèle d’intelligence artificielle ingère de nombreuses données qu’il synthétise ensuite en un contenu apparemment original.

« C’était un sentiment très perturbant », a déclaré Preston, « un peu comme si je rentrais à la maison et découvrais que quelqu’un était entré chez toi et avait pris des choses. »

Ces inquiétudes ont conduit Preston à signer un recours collectif proposé accusant OpenAI, le développeur derrière ChatGPT et un acteur majeur du secteur en pleine croissance de l’IA, de violation du droit d’auteur. (OpenAI a récemment poursuivi une valorisation de 80 à 90 milliards de dollars.)

Preston est rejoint dans le procès par une foule d’autres auteurs de renom, dont John Grisham, Jonathan Franzen, Jodi Picoult et George RR Martin – l’auteur notoirement lent à publier « Game of Thrones » qui, selon Preston, a rejoint le par frustration que les fans utilisaient ChatGPT pour générer de manière préventive le dernier livre de sa série.

OpenAI, pour sa part, a soutenu que la formation d’un système d’IA relève des protections contre l’utilisation équitable, en particulier compte tenu de la mesure dans laquelle l’IA transforme les données de formation sous-jacentes en quelque chose de nouveau. Dans une déclaration envoyée par courrier électronique, un porte-parole d’OpenAI a déclaré au Times que l’entreprise respecte les droits des auteurs et estime qu’ils devraient « bénéficier de la technologie de l’IA ».

« Nous avons des conversations productives avec de nombreux créateurs du monde entier, y compris la Guilde des auteurs, et avons travaillé en coopération pour comprendre et discuter de leurs préoccupations concernant l’IA », a déclaré le porte-parole. « Nous sommes optimistes et continuerons à trouver des moyens mutuellement bénéfiques de travailler ensemble pour aider les gens à utiliser les nouvelles technologies dans un écosystème de contenu riche. »

Néanmoins, l’industrie de l’édition fait marche arrière, car elle s’attend à un boom des logiciels qui donne à toute personne disposant du WiFi le pouvoir de générer automatiquement de grandes quantités de texte. En plus du procès de Preston, divers autres groupes d’auteurs poursuivent leurs propres recours collectifs contre OpenAI.

« Tout le monde se rend compte à quel point ses données, ses informations, sa créativité ont été absorbées », a déclaré Ed Nawotka, rédacteur en chef de Publishers Weekly. Il existe, dans l’industrie, un certain degré de « panique abjecte ».

Dans une récente paire de poursuites, Sarah Silverman a accusé OpenAI ainsi que Meta, la société mère de Facebook et elle-même un développeur majeur d’IA, de violation du droit d’auteur. Les deux sociétés ont depuis fait pression pour que la plupart des dossiers de Silverman soient rejetés.

Un autre procès a récemment vu Paul Tremblay (« La Cabane du bout du monde ») et Mona Awad (« Lapin ») poursuivre OpenAI pour violation du droit d’auteur – la société tente également de faire rejeter celle-ci – tandis que Michael Chabon ( » Le Syndicat des policiers yiddish ») est plaignant dans deux autres actions en justice qui visent respectivement OpenAI et Meta.

Et en juillet dernier, la Guilde des auteurs – un groupe professionnel et non un syndicat – a envoyé à plusieurs entreprises technologiques une lettre ouverte appelant au consentement, au crédit et à une compensation équitable lorsque les œuvres d’écrivains sont utilisées pour former des modèles d’IA. Parmi les signataires figuraient Margaret Atwood, Dan Brown, James Patterson, Suzanne Collins, Roxane Gay et Celeste Ng.

Tout cela s’ajoute à la grève de près de 5 mois que les scénaristes d’Hollywood ont récemment entreprise et qui a conduit, entre autres, à de nouvelles réglementations sur l’utilisation de l’IA pour la génération de scénarios. (Une grève distincte, toujours en cours, a vu les acteurs du cinéma se rallier autour de leurs propres préoccupations en matière d’IA.)

Le procès dans lequel Preston est impliqué, qui comprend 17 autres plaignants nommés, dont la Guilde des auteurs, affirme qu’OpenAI a copié les œuvres des auteurs « sans autorisation ni contrepartie » afin de former des programmes d’IA qui rivalisent désormais avec ces auteurs pour le temps et le temps des lecteurs. argent.

La poursuite conteste également la génération par ChatGPT d’œuvres dérivées, ou de « matériel basé sur, imitant, résumant ou paraphrasant [the] Les plaignants travaillent et nuisent au marché pour eux. »

Les plaignants demandent des dommages-intérêts pour leurs opportunités de licence perdues et leur « usurpation de marché », ainsi qu’une injonction contre de telles pratiques futures, au nom des auteurs de fiction américains dont les œuvres protégées par le droit d’auteur ont été utilisées pour former le logiciel OpenAI.

« Ils ne nous ont pas demandé la permission et ils ne nous indemnisent pas », a déclaré Preston à propos d’OpenAI. « Ce qu’ils ont fait, c’est créer un produit commercial très précieux qui peut reproduire nos voix. … Il s’agit essentiellement d’un vol de notre travail créatif à grande échelle. »

Étant donné que les livres des plaignants ne sont pas disponibles gratuitement sur le Web ouvert, a-t-il ajouté, OpenAI y a « presque certainement » accédé via des sites de piratage présumés tels que la plateforme de partage de fichiers LibGen. (La poursuite réitère ces soupçons, les attribuant à des « chercheurs indépendants en IA ».)

OpenAI refuse de répondre à la question de savoir si les livres des plaignants faisaient partie des données de formation de ChatGPT ou étaient accessibles via des sites de partage de fichiers tels que LibGen. Dans une déclaration à l’Office américain des brevets et des marques citée dans le procès de la Authors Guild, OpenAI a déclaré que les systèmes d’IA modernes sont parfois formés sur des ensembles de données accessibles au public qui incluent des œuvres protégées par le droit d’auteur.

The Atlantic a rapporté que Meta, quant à lui, avait formé son concurrent ChatGPT, LLaMA, sur un corpus d’ebooks piratés connu sous le nom de « Books3 ». Une version consultable de cet ensemble de données indique que LLaMA s’est nourrie de livres écrits par presque toutes les personnes citées comme plaignants dans les différents procès susmentionnés.

Les travaux des membres du personnel du LA Times ont également été inclus. Meta n’a pas répondu à une demande de commentaires du Times sur la façon dont LLaMA a été formée.

Mis à part les sources spécifiques des données de formation, de nombreux auteurs s’inquiètent de la place que cette technologie mènera dans leur secteur.

Michael Connelly, auteur de la série de romans policiers Harry Bosch et autre plaignant dans le procès de la Authors Guild, a formulé ces préoccupations comme une question de contrôle : « le contrôle de votre propre travail, de votre propre propriété ».

Connelly n’a jamais eu à décider si ses livres seraient utilisés pour entraîner une IA, a-t-il déclaré, mais si on le lui avait demandé – même s’il y avait de l’argent sur la table – il aurait probablement choisi de ne pas le faire. L’idée que ChatGPT écrive une suite non officielle de Bosch lui semble une violation ; même lorsqu’Amazon a adapté la série en émission télévisée, dit-il, il avait un certain contrôle sur les scripts et le casting.

« Ces personnages nous appartiennent », a déclaré Connelly. « Ils nous sortent de la tête. J’ai même mis des choses dans mon testament à propos de [how] aucun autre auteur ne pourra porter le flambeau d’Harry Bosch après mon départ. Il est à moi et je ne veux pas que quelqu’un d’autre raconte son histoire. Je ne veux certainement pas qu’une machine le dise. »

Mais savoir si la loi permettra aux machines de le faire est une autre question.

Les différentes poursuites contre OpenAI allèguent des violations du droit d’auteur. Mais la loi sur le droit d’auteur – et en particulier sur l’utilisation équitable, le domaine du droit qui détermine quand une œuvre protégée par le droit d’auteur peut être incorporée à d’autres efforts, par exemple à des fins d’éducation ou de critique – n’offre toujours pas de réponse simple quant à la manière dont ces droits d’auteur peuvent être incorporés à d’autres efforts, par exemple à des fins d’éducation ou de critique. les procès vont éclater.

« Nous avons actuellement une sorte de va-et-vient dans la jurisprudence », a déclaré l’avocat en propriété intellectuelle Lance Koonce, associé du cabinet d’avocats Klaris, en soulignant deux affaires récentes de la Cour suprême qui proposent des modèles concurrents d’utilisation équitable.

Dans l’affaire Authors Guild contre Google, le tribunal a jugé que Google était autorisé à numériser des millions de livres protégés par le droit d’auteur afin de les rendre consultables. Dans l’autre affaire, Andy Warhol Foundation for the Visual Arts Inc. contre Goldsmith, le tribunal a jugé que l’incorporation par l’artiste pop titulaire du travail d’un photographe dans son propre art ne relevait pas de l’usage loyal parce que l’art de Warhol était commercial et avait le même objectif fondamental comme la photo originale.

« Ces affaires liées à l’IA, et en particulier l’affaire Authors Guild (contre OpenAI), tombent dans cette tension », a déclaré Koonce.

Dans la déclaration de son bureau des brevets, OpenAI a fait valoir que la formation de logiciels d’intelligence artificielle sur des œuvres protégées par le droit d’auteur « ne devrait pas, en soi, nuire au marché ou à la valeur des œuvres protégées par le droit d’auteur », car les œuvres sont consommées par des logiciels plutôt que par de vraies personnes.

En dehors des voies juridiques, les parties prenantes proposent déjà des solutions à cette tension.

Suman Kanuganti, directeur général de la plateforme de messagerie d’IA Personal.ai, a déclaré que l’industrie technologique adoptera probablement une sorte de norme d’attribution permettant d’identifier et de rémunérer les personnes qui contribuent aux données de formation d’une IA.

« Une fois que vous avez construit les modèles avec des unités de données connues et authentifiées, ce n’est pas un défi technologique », a déclaré Kanuganti. « Et une fois que vous avez résolu ce problème… l’association économique devient alors plus facile. »

Preston, le romancier d’aventures, a convenu qu’il y avait peut-être encore une voie à suivre.

L’attribution de licences aux développeurs de logiciels via un centre d’échange centralisé pourrait fournir aux auteurs une nouvelle source de revenus tout en garantissant des données de formation de haute qualité pour les entreprises d’IA, a-t-il déclaré, ajoutant que la Guilde des auteurs avait tenté à un moment donné de mettre en place un tel accord avec OpenAI. mais que les deux parties n’ont pas réussi à parvenir à un accord. (OpenAI a refusé de discuter de telles conversations.)

« Nous essayions de les amener à s’asseoir avec nous de bonne foi ; nous ne sommes pas du tout opposés à l’IA », a déclaré Preston. « Ce n’est pas un jeu à somme nulle. »