Introduction de la Generative AI Copyright Disclosure Act aux États-Unis
Une loi pour obliger les entreprises à divulguer toute œuvre protégée par le droit d’auteur utilisée dans la formation de modèles d’intelligence artificielle (IA) générative, sous peine de lourdes amendes. Le Generative AI Copyright Disclosure Act a été présenté par le membre du Congrès californien. Adam Schiffqui a demandé un équilibre entre respect de la créativité et progrès technologique.
« Nous devons équilibrer l’immense potentiel de l’IA avec le besoin crucial de lignes directrices et de protections éthiques », a déclaré Schiff. « Ma Generative AI Copyright Disclosure Act est une étape cruciale dans cette direction. Il stimule l’innovation en protégeant les droits et les contributions des créateurs, en garantissant qu’ils soient conscients lorsque leur travail contribue aux ensembles de données de formation à l’IA.
Les entreprises qui ne respecteraient pas le projet de loi, s'il devenait loi, s'exposeraient à des sanctions civiles d'au moins 5 000 $. Le registre serait chargé d'imposer des amendes et de créer une base de données en ligne accessible au public contenant les notifications soumises, afin que les titulaires de droits d'auteur puissent vérifier si leurs œuvres ont été utilisées dans les ensembles de données de formation.
Index des sujets :
Ce que prévoit la Generative AI Copyright Disclosure Act
La Generative AI Copyright Disclosure Act obligerait les développeurs de modèles comme OpenAI à soumettre une notification au registre des droits d'auteur avant de publier un nouveau système, indiquant quels matériaux protégés par le droit d'auteur ont été utilisés à la fois dans la formation et le perfectionnement. Les entreprises auraient jusqu'à 30 jours après la publication pour soumettre des divulgations, qui devraient contenir un « résumé suffisamment détaillé » des œuvres protégées par le droit d'auteur utilisées, y compris les URL de tout ensemble de données de formation accessibles au public.
Les exigences du projet de loi s'appliqueraient également de manière rétroactive aux systèmes d'IA générative précédemment publiés, ce qui signifie que des modèles comme ChatGPT et Claude seraient soumis à un examen minutieux.
La facture de Schiff a déjà obtenu le soutien des organisations et syndicats du secteur des médias, notamment de la Recording Industry Association of America, de la SAG-AFTRA et de la Writers Guild of America..
« Tout ce qui est généré par l’IA provient en fin de compte d’une source créative humaine. C’est pourquoi le contenu créatif humain – la propriété intellectuelle – doit être protégé », a-t-il déclaré. Duncan Crabtree-Irlandedirecteur exécutif national et négociateur en chef du SAG-AFTRA.
« SAG-AFTRA soutient pleinement la Generative AI Copyright Disclosure Act, car cette législation constitue une étape importante pour garantir que la technologie sert les gens, et non l'inverse. »
Poursuites contre l’IA générative
Les entreprises qui développent des modèles d’IA générative ont fait l’objet de plusieurs poursuites au cours de l’année écoulée pour des allégations selon lesquelles elles auraient utilisé du contenu protégé par le droit d’auteur pour former des systèmes sans autorisation. Le créateur de ChatGPT, OpenAI, rejette les accusations du New York Times selon lesquelles son chatbot génère du contenu à partir de ses articles. Des auteurs de livres, des éditeurs de musique et des artistes ont poursuivi des développeurs pour violation du droit d'auteur, Nvidia, Anthropic et Stability AI étant parmi les personnes poursuivies.
Une recherche de la startup d'IA Patronus a récemment révélé que le GPT-4 d'OpenAI était le modèle qui reproduisait le contenu le plus protégé par le droit d'auteur. Pour garantir l'accès aux documents protégés par le droit d'auteur, les créateurs de modèles ont cherché à conclure des partenariats avec des sociétés de médias ou de médias sociaux afin d'utiliser leurs vastes réserves de données pour la formation de modèles. OpenAI, par exemple, détient des licences de contenu d'Axel Springer et d'Associated Press, tandis que Google a récemment signé un accord avec Reddit. OpenAI a déclaré en janvier qu’il serait « impossible » de développer des modèles de pointe sans accès à du matériel protégé par le droit d’auteur.