L'IA saute les droits d'auteur depuis des années avec l'excuse de «l'utilisation équitable». Le juge américain le voit parfait

L'IA saute les droits d'auteur depuis des années avec l'excuse de «l'utilisation équitable». Le juge américain le voit parfait

Anthropic vient d'atteindre une victoire juridique très importante dans cette bataille juridique que le monde de l'IA maintient avec le droit d'auteur et le droit d'auteur pendant des années. La phrase, favorable à Anthropic, peut s'asseoir un grand précédent pour le reste des cas dans lesquels les entreprises d'IA ont été poursuivis pour former leurs modèles avec des œuvres avec le droit d'auteur. Mais soyez prudent, car cela n'a pas été une victoire totale.

Victoire antopique. Dans la demande de trois auteurs contre Anthropic, la société a été accusée de télécharger des millions de livres avec le droit d'auteur, en plus d'acheter certains d'entre eux pour les numériser et les numériser. L'objectif: former leurs modèles d'IA. Le juge William Alsup a clairement indiqué dans sa peine que « l'usage de la formation était une utilisation équitable ». Les entreprises qui développent des modèles d'IA ont toujours protégé ce concept d'utilisation juste pour argumenter comment leurs modèles avec toutes sortes d'œuvres, y compris ceux protégés par le droit d'auteur.

Usage équitable. Ce critère légal soutient que l'utilisation limitée de matériel protégé est autorisée sans avoir besoin de l'autorisation du propriétaire de ces droits. Dans les lois du droit d'auteur, l'une des façons dont les juges doivent déterminer si ce type d'activité est une utilisation équitable est d'examiner si cette utilisation était «transformateur». Ou quelle est la même chose, si quelque chose de nouveau a été créé à partir de ces œuvres. Pour ALSUP « La technologie en question est l'un des plus transformateurs que beaucoup d'entre nous verront dans nos vies ».

Une victoire avec un grand astérisque. Bien que le juge ait indiqué que ce processus de formation était une utilisation équitable, il a également déterminé que les auteurs pouvaient mener anthropic au procès pour avoir piraté leurs travaux. La société a fait valoir que cela était justifié parce qu'il était « au moins raisonnablement nécessaire pour former les LLM ». Pour Alsup, le problème est précisément que bien qu'ils aient fini par en acheter certains, il a construit une énorme bibliothèque pour laquelle il n'a pas payé:

« Anthropic a téléchargé plus de sept millions de copies pirates de livres, n'a rien payé et a conservé ces copies de pirate dans sa bibliothèque même après avoir décidé qu'il ne les utiliserait pas pour former leur IA (du tout ou plus jamais). Les auteurs soutiennent que Anthropic aurait dû payer pour ces copies pirates de la bibliothèque. Cette phrase coïncide avec. »

Précédent de Thomson-Reuters. Il y a quelques mois, Thomson Reuters a remporté un procès en 2020 contre une start-up de renseignement Ross So Selon eux, la société avait reproduit des documents de sa division de recherche juridique, appelée Westlaw. Le juge a rejeté les arguments de la défense et a déclaré que l'argument pour une utilisation équitable ne pouvait pas être appliqué dans cette affaire. La phrase contre Anthropic est juste dans la direction opposée et bénit ce type d'utilisation … tandis que les entreprises achètent les œuvres avec lesquelles ils forment leurs modèles. Soit dit en passant, la compagnie de l'IA avait déjà remporté une petite victoire juridique dans une affaire précédente contre la musique universelle.

Books à morceaux téléchargés anthropiques. L'essai a été révélé comment le co-fondateur d'Anthropic, Ben Mann, a téléchargé dans les ensembles de données de l'hiver 2021 tels que les livres So-Salled3 ou Libgen (bibliothèque Genesis) qui ne sont rien de plus que des compilations de livres gigantesques, dont beaucoup sont protégés par le droit d'auteur.

L'objectif est dans le même. Toutes les entreprises qui développent des modèles d'IA ont été formées avec tous les types de données, y compris les œuvres protégées par le droit d'auteur, et elles sont toutes confrontées à une situation similaire. Meta, par exemple, a téléchargé 81,7 To de livres avec le droit d'auteur via BitTorrent pour entraîner leurs modèles d'IA. Cela fait que la compagnie de Mark Zuckerberg peut finir par subir une destination similaire à celle d'Anthropic, qui a devant lui un nouveau processus judiciaire très dangereux pour ses finances.

Une amende potentielle de milliards de dollars. Comme indiqué dans Wired, l'amende minimale pour ce type de viol de droit d'auteur est de 750 $ par livre. ALSUP a indiqué que la bibliothèque anthropique non chargée illégalement se compose d'au moins sept millions de livres, ce qui signifie que l'entreprise est confrontée à une amende potentiellement énorme. Pour le moment, il n'y a pas de date pour ce nouveau procès.

Des millions de personnes sont à nouveau intéressées par le chatppt. Le problème est qu'il l'a réalisé en violant le droit d'auteur

La bataille sans fin de l'IA et du droit d'auteur. C'est le dernier épisode d'un feuilleton que nous verrons sans aucun doute beaucoup plus de chapitres. Des entreprises telles que Google, OpenAI ou perplexité ont été tout aussi voraces lors de la formation de leurs modèles et ont dévasté des données publiques (et pas si publiques) sur Internet. Les demandes de viol de Copyright s'accumulent, et des cas tels que anthropic peuvent associer une perturbation prédictive pour chacun d'eux s'ils n'achètent pas les livres qu'ils ont utilisés pour former leurs modèles.

Image | Emil Widlund

Dans Simseo | 5 000 « jetons » de mon blog sont utilisés pour former une IA. Je n'ai pas donné ma permission