Les principaux problèmes du dossier des écrivains contre OpenAI expliqués

Il y a eu beaucoup de buzz autour de ChapGPT, Bard et d’autres outils d’IA générative depuis qu’ils ont été rendus publics en janvier. Mais tout le monde n’est pas satisfait de l’essor des chatbots. De nombreux écrivains, artistes, photographes, musiciens et cinéastes affirment que les entreprises technologiques utilisent des œuvres protégées par le droit d’auteur pour former des modèles d’IA génératifs.

Il y a maintenant plusieurs poursuites en cours contre OpenAI, le développeur de ChatGPT, dont une déposée mardi devant le tribunal fédéral de district de New York par la Authors Guild au nom de dizaines d’auteurs à succès, dont Elin Hilderbrand, Jonathan Franzen et George RR Martin. .

Les auteurs affirment qu’OpenAI alimente leurs livres dans l’algorithme de modèle de langage à grande échelle de ChatGPT sans consentement, compensation ou attribution, en violation de la loi américaine sur le droit d’auteur. Qualifiant cela de « vol systématique à grande échelle », la guilde demande une injonction permanente et des dommages-intérêts pour les opportunités de licence perdues et pour avoir fait des auteurs des « complices involontaires » de leur propre inutilité future sur le marché.

OpenAI a déclaré que les livres sont utilisés uniquement pour stimuler l’innovation, et non pour créer de nouvelles œuvres, et que cette pratique est légale en vertu de la disposition « d’utilisation équitable » de la loi sur le droit d’auteur.

Rebecca Tushnet étudie et enseigne le droit d’auteur et le droit des marques en tant que professeur Frank Stanton du premier amendement à la Harvard Law School. Dans une conversation avec la Gazette, elle a parlé du cas des auteurs contre OpenAI et de certaines des questions juridiques plus larges liées aux technologies émergentes. L’interview a été éditée pour plus de clarté et de longueur.

GAZETTE : Les auteurs affirment qu’OpenAI « vole » leurs livres pour améliorer la capacité de ChatGPT à cracher des « œuvres dérivées », en violation flagrante des lois sur le droit d’auteur. La loi est-elle claire sur cette question ?

TUSHNET : Non. Et en fait, la loi en matière d’utilisation d’œuvres à des fins de formation ou à des fins d’exploration de données à grande échelle a souvent été considérée comme un usage loyal. L’Internet tel que nous le connaissons aujourd’hui, avec Google, la recherche d’images et Google Books, n’existerait pas s’il n’était pas équitable d’utiliser ces mots et d’obtenir une sortie qui n’était pas une copie.

Maintenant, le résultat suscite des questions légitimes. En théorie, si vous créez une reproduction contrefaite, elle reste une contrefaçon même si personne ne la voit. La question est une question de responsabilité. Devons-nous dire : « Vous ne devriez pas fabriquer d’ordinateurs parce qu’ils peuvent être utilisés à des fins de contrefaçon » – ce que les titulaires de droits d’auteur pensaient effectivement il y a 20 ans – ou devrions-nous dire : « Ce que nous avons ici est un outil qui peut être utilisé ou mal utilisé. , et nous devrions nous concentrer sur la lutte contre les abus. »

GAZETTE : Comment la loi protège-t-elle les œuvres protégées par le droit d’auteur ?

TUSHNET : Vous disposez de droits contre la reproduction ou la création d’œuvres dérivées, sous réserve de limites telles que l’usage loyal. Il existe d’autres limites spécifiques, mais la plus importante est l’utilisation équitable.

GAZETTE : La définition de l’utilisation équitable est-elle le principal problème ici ?

TUSHNET : C’est là que va aboutir cet argument. Les deux questions seront : l’utilisation équitable des données d’entraînement, ce qui, je pense, est assez clair dans le cadre de la loi actuelle. Et puis, qui est responsable des résultats : est-ce le prompteur ou est-ce l’existence de l’outil ? La loi, telle qu’elle existe, est raisonnablement établie. Mais la loi peut changer. Je pense qu’OpenAI a le dessus sur l’argument, mais nous verrons ce qu’en pense le tribunal.

GAZETTE : Y a-t-il des lacunes ou des exclusions dans la loi pour des secteurs particuliers, comme la technologie ?

TUSHNET : La loi sur le droit d’auteur n’est pas comme un ensemble de règles que l’on peut insérer sur une page ; c’est plusieurs centaines de pages denses. Existe-t-il des protections pour des secteurs spécifiques ? Il y en a une tonne. Il existe des dispositions spéciales pour les camps religieux et les associations d’agriculteurs, et toutes sortes de choses. Mais aucun d’entre eux n’est vraiment pertinent pour la plupart des problèmes liés à l’IA, sauf dans la mesure où il existe des régimes de notification et de retrait pour les cas où le résultat de l’IA est public. Le Congrès a établi des règles spéciales pour les sociétés Internet afin de tenir compte du fait que l’échelle d’Internet était si grande qu’elles ne pouvaient pas traiter Google comme un éditeur ordinaire.

GAZETTE : La législation actuelle sur le droit d’auteur est-elle suffisante pour faire face à cette nouvelle frontière technologique ?

TUSHNET : Là où des garde-fous sont nécessaires, le droit d’auteur n’est pas la bonne manière de gérer la situation. Les titulaires de droits d’auteur, en général, ont intérêt à être payés, ce qui n’est pas un intérêt à obtenir un résultat socialement bénéfique, ou à éviter les mensonges, les hallucinations ou quoi que ce soit du genre. Le droit d’auteur ne répond pas à des questions telles que : « Comment pouvez-vous vous assurer que l’IA ne diffame pas quelqu’un ou ne vous donne pas d’instructions sur la façon de manger un champignon venimeux ? » La loi, en particulier celle relative à l’usage loyal, a été conçue pour être flexible et pour faire face à de nouvelles situations. Et c’est plutôt bien fait.

GAZETTE : Avez-vous déjà une idée de la façon dont les tribunaux pourraient examiner cette question ou est-il trop tôt pour le dire ?

TUSHNET : On a souvent tendance à dire : « C’est complètement différent de tout ce que nous avons jamais vu. Nous avons besoin d’une nouvelle règle. » Parfois, c’est vrai. Mais bien souvent, nos principes existants s’en occupent. À l’heure actuelle, le bureau du droit d’auteur déclare que si une œuvre est générée par l’IA, elle n’est pas protégée par le droit d’auteur ; vous avez besoin d’un humain pour créer. Cela me semble être vrai. Cela étant dit, vous pouvez impliquer un humain dans la modification d’une œuvre générée par l’IA afin qu’elle devienne une expression de sa propre créativité. Et cela peut avoir un droit d’auteur valide. Je ne peux pas posséder la forêt, mais si je prends une belle photo de la forêt, je peux détenir un droit d’auteur sur ma belle photo, mais uniquement sur ce que j’ai fait.

Le problème est que le cycle de l’information est beaucoup plus rapide que le cycle juridique. Il est très difficile de dire dans l’abstrait quand quelque chose a suffisamment changé pour que vous vouliez vraiment vous lancer dans une nouvelle loi et quand vous voulez laisser le système juridique existant s’en occuper. Les gens finissent par revenir à leurs croyances antérieures sur diverses choses. Si vous pensez que la grande technologie est fondamentalement mauvaise, vous voudrez de nouvelles règles. Si vous pensez que les grands détenteurs de droits d’auteur ne veulent que de l’argent, alors vous direz probablement : « Laissons le système judiciaire s’en occuper ». Et donc, je pense que nous sommes définitivement dans la période trop tôt pour le dire. À l’heure actuelle, l’ensemble de formation est d’usage équitable. En ce qui concerne le résultat, je n’ai aucun doute qu’un avocat avisé peut obtenir un résultat qui semble contrefait. Mais la question est : à qui devons-nous attribuer cette production ?

GAZETTE : Est-il prématuré d’essayer de régler certaines questions juridiques plus larges avant que la technologie n’ait atteint sa pleine maturité ?

TUSHNET : C’est une bonne question. Le problème est que les choses évoluent souvent de manière très imprévisible. Thomas Edison pensait que les hommes d’affaires utiliseraient le phonographe pour enregistrer des mémos et se les envoyer par courrier. Ce n’est pas du tout ainsi qu’il a été utilisé. Il n’avait rien prévu de semblable à l’industrie musicale que nous avons aujourd’hui. Le risque bien connu de la réglementation actuelle est que nous rédigerons des lois en partant du principe qu’elles vont faire une chose, et passerons complètement à côté du chemin réel du développement technologique, y compris en manquant des choses que nous aurions dû réglementer. C’est pourquoi ma position générale est la suivante : si vous vous souciez du risque de perte d’emplois, nous devons nous tourner vers le droit du travail et le droit de la concurrence déloyale. Le droit d’auteur ne va pas vous aider avec ça. En ce qui concerne la diffamation, la façon de traiter ce problème est d’avoir une règle interdisant de diffamer les gens. Peu importe qu’il ait été généré par l’IA : nous ne voulons pas que vous fassiez cela.

Fourni par la Harvard Gazette