Le Parlement européen en a assez des majors de l’IA qui volent des contenus protégés. Il est temps de payer
Il y a quelques semaines, le Washington Post publiait cette image du « Projet Panama » :

Il s’agit d’un entrepôt avec des centaines de milliers de livres attendant leur tour d’être numérisés et détruits au passage. Il fait partie d'un programme interne d'Anthropic pour entraîner son IA et est le résultat d'achats de dizaines de millions de dollars pour numériser toutes ces œuvres sans l'autorisation de leurs auteurs.
Ils ne sont pas les seuls à « emprunter » des contenus protégés par le droit d’auteur pour entraîner leur intelligence artificielle et l’Union européenne est claire sur une chose : ils doivent cesser de voler des contenus protégés et accorder des licences appropriées pour les œuvres destinées à entraîner l’IA.
Et les entreprises d’IA se défendent en affirmant que personne ne pensera aux petites entreprises.
L’Europe est claire : si vous voulez former l’IA, payez l’auteur
Il est curieux de voir comment l'industrie du divertissement et la régulation des pays se sont serré la main au début des années 2000 avec ces publicités du type « vous ne voleriez pas de sac à main. Vous ne voleriez pas de voiture. Ne volez pas de film ». Ils décrivaient la copie d'un CD ou le téléchargement d'un film comme si vous pénétriez dans les systèmes du Pentagone.

Des années plus tard, cette même industrie fait la sourde oreille face à ce que font les grandes entreprises technologiques pour former l’IA. Le document du Washington Post précise que d’autres comme Meta, Google et OpenAI avaient également participé à la course pour obtenir des données massives pour leurs modèles.
Il existe de nombreux exemples, comme les 81,7 To de livres protégés par le droit d'auteur que Meta a téléchargés ou le fait qu'OpenAI a utilisé l'animation de tous les studios pour entraîner son IA (ce qui lui a valu les reproches de Ghigli et d'autres studios japonais et se plaignant que Deepseek a pillé ChatGPT).
Compte tenu du contexte, il est temps de dire que le Parlement européen en a assez de cela et a fait l’une des choses qu’il fait le mieux : légiférer. Dans ce cas, il est tout à fait logique que l’Europe prenne cette mesure, et l’organisation a publié un rapport non contraignant qui exhorte la Commission européenne à élaborer des normes qui sélectionnent des normes minimales pour ces entreprises d’IA.
« L'IA générative ne doit pas fonctionner en dehors de l'État de droit »
Fondamentalement, s’ils utilisent un contenu protégé pour leur formation, ils doivent l’obtenir sous licence et également rémunérer les auteurs. Sous le titre « Protéger les œuvres créatives protégées par le droit d'auteur à l'ère de l'IA », le Parlement européen exige une série de mesures allant au-delà des licences pour les œuvres. Ce sont les suivants :
- Appelle à l’utilisation transparente et rémunérée de contenus protégés pour former l’IA générative.
- Les fournisseurs d’IA sont censés reconnaître et payer pour les œuvres protégées par le droit d’auteur qu’ils ont utilisées pour former leurs systèmes.
- Mesures permettant aux propriétaires d'œuvres titulaires de droits d'exclure de la formation leur œuvre protégée.
La raison pour laquelle les députés soutiennent que « l'IA générative ne devrait pas fonctionner en dehors de l'État de droit. Si des œuvres protégées par le droit d'auteur sont utilisées pour former des systèmes d'intelligence artificielle, les créateurs ont droit à la transparence, à la sécurité juridique et à une compensation équitable ».
Le Groupe européen des sociétés d’auteurs et compositeurs, ou GESAC, va dans le même sens. Dans des déclarations à Euronews, Adriana Moscoso del Prado, directrice générale du GESAC ; assure que « ce vote s'ajoute à la reconnaissance croissante au niveau européen des enjeux. L'innovation, l'équité et la souveraineté culturelle doivent aller de pair ».
Les entreprises d’IA ripostent
De la part de la CCIA, l’Association de l’industrie de l’informatique et des communications, il a été souligné qu’il ne s’agit pas d’une mesure visant à protéger les artistes, mais plutôt d’une « taxe de conformité ». C’est-à-dire quelque chose qu’ils doivent accomplir quoi qu’il arrive et qui va à l’encontre du progrès. Le groupe a fait valoir qu’une telle mesure n’irait pas contre les grandes entreprises, mais contre les petites.
Ils affirment que beaucoup auront du mal à négocier des accords de licence complexes avec de grands éditeurs, « freinant la compétitivité numérique de l'Europe sur la scène mondiale » et affirmant que ce qu'ils devraient faire, c'est améliorer les lois existantes dans l'Union européenne, y compris la loi sur l'IA et la directive sur le droit d'auteur.

De toute façon, il n’y a rien sur la table pour le moment. Comme nous le disons, il s’agit d’un rapport d’initiative du Parlement et n’est pas contraignant. La Commission peut désormais déterminer si elle doit le faire ou non, mais elle indique clairement une chose : la position du Parlement sur toute future mesure d'IA de la Commission.
Le problème est que l’IA générative a déjà pillé des millions d’œuvres protégées par le droit d’auteur sur lesquelles elle pourra construire ses prochaines interactions. Le logiciel dispose de tonnes d’informations sur lesquelles s’appuyer et peut évoluer dans d’autres domaines, comme arrêter les hallucinations par exemple.
Et c'est un autre exemple des deux vitesses de cette affaire : les technologiques font les premiers pas et les législateurs derrière eux voient ce qui peut être fait alors que la loi sur laquelle ils veulent légiférer a déjà été réalisée il y a des années.
Images | Washington Post, Campagne anti-piratage (édité)
À Simseo | L'industrie de l'IA n'est durable qu'en violant les lois sur le droit d'auteur. Alors il essaie de les éradiquer
