Le juge américain s'adapte à la méta dans l'affaire du droit d'auteur de la formation de l'IA
Un juge américain a remis mercredi à Meta une victoire sur les auteurs qui ont accusé le géant de la technologie d'avoir violé la loi sur le droit d'auteur en formant l'intelligence artificielle de lama sur leurs créations sans autorisation.
Le juge du tribunal de district Vince Chhabria à San Francisco a jugé que l'utilisation de Meta des œuvres pour former son modèle d'IA était suffisamment « transformatrice » pour constituer « une utilisation équitable » en vertu de la loi sur le droit d'auteur, dans le deuxième triomphe de ces salles d'audience pour les entreprises de l'IA cette semaine.
Cependant, il est venu avec une mise en garde que les auteurs auraient pu présenter un argument gagnant selon lequel en entraînant une puissante AI générative avec des œuvres protégées par le droit d'auteur, les entreprises technologiques créent un outil qui pourrait permettre à une mer d'utilisateurs de rivaliser avec eux sur le marché littéraire.
« Peu importe à quel point la formation transformatrice (IA générative) peut être, il est difficile d'imaginer qu'il peut être une utilisation équitable pour utiliser des livres protégés par le droit d'auteur pour développer un outil pour gagner des milliards ou des milliards de dollars tout en permettant la création d'un flux potentiellement sans fin d'œuvres concurrentes qui pourraient nuire considérablement le marché pour ces livres », a déclaré Chhabria dans sa décision.
Des quantités énormes de données sont nécessaires pour former de grands modèles de langage alimentant une IA générative.
Les musiciens, les auteurs de livres, les artistes visuels et les publications de nouvelles ont poursuivi diverses sociétés d'IA qui ont utilisé leurs données sans autorisation ni paiement.
Les entreprises d'IA défendent généralement leurs pratiques en réclamant une utilisation équitable, faisant valoir que la formation de l'IA sur de grands ensembles de données transforme fondamentalement le contenu original et est nécessaire à l'innovation.
« Nous apprécions la décision d'aujourd'hui du tribunal », a déclaré un porte-parole de Meta en réponse à une enquête AFP.
« Les modèles d'IA open source alimentent les innovations transformatrices, la productivité et la créativité pour les particuliers et les entreprises, et l'utilisation équitable du matériel de droit d'auteur est un cadre juridique vital pour construire cette technologie transformatrice. »
Dans le cas avant Chhabria, un groupe d'auteurs a poursuivi Meta pour avoir téléchargé des copies piratées de leurs œuvres et les utiliser pour former le Llama Generative IA de l'Open-source, selon des documents judiciaires.
Les livres impliqués dans le costume incluent les mémoires comiques de Sarah Silverman « The Bedwetter » et le roman vainqueur du prix Pulitzer de Junot Diaz « The Brief Wondrous Life of Oscar Wao », ont montré les documents.
« Cette décision ne représente pas la proposition selon laquelle l'utilisation par Meta des documents protégés par le droit d'auteur pour former ses modèles linguistiques est légale », a déclaré le juge.
« Il ne dépend que de la proposition selon laquelle ces plaignants ont fait de mauvais arguments et n'ont pas développé un dossier à l'appui de la bonne. »
Début du marché?
Un autre juge fédéral à San Francisco s'est rassuré lundi avec la société d'IA Anthropic concernant la formation de ses modèles sur les livres protégés par le droit d'auteur sans l'autorisation des auteurs.
Le juge du tribunal de district William Alsup a jugé que la formation par la société de ses modèles de Claude AI avec des livres achetés ou piratés était autorisé en vertu de la doctrine de la « Fair Use » dans la loi américaine sur le droit d'auteur.
« L'utilisation des livres en cause pour former Claude et ses précurseurs était extrêmement transformatrice et était une utilisation équitable », a écrit Alsup dans sa décision.
« La technologie en cause était parmi les plus transformatrices que beaucoup d'entre nous verront de notre vie », a ajouté Alsup dans sa décision, en comparant la formation de l'IA à la façon dont les humains apprennent en lisant des livres.
La décision découle d'un recours collectif déposé par les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson, qui a accusé Anthropic de copier illégalement leurs livres pour former le chatbot Claude, le rival de Chatgpt de la société.
Alsup a rejeté l'offre d'Anthropic pour la protection générale, jugeant que la pratique de la société de télécharger des millions de livres piratés pour construire une bibliothèque numérique permanente n'était pas justifiée par des protections d'utilisation équitable.