Adobe se présente comme un champion des créateurs à l'ère de l'IA. Le procès allègue qu'il a utilisé des livres protégés par le droit d'auteur

Adobe a construit une partie de sa stratégie d'intelligence artificielle sur un thème très reconnaissable : protéger les créateurs à une époque de profonds changements. Alors que d’autres entreprises technologiques accumulaient les critiques sur l’origine de leurs données, l’entreprise se présentait comme une alternative responsable. Cette position fait maintenant face à un procès qui porte sur la formation de l'un de ses modèles et l'utilisation d'œuvres protégées par le droit d'auteur. Il ne s’agit pas d’une anomalie, mais plutôt du reflet d’une question à laquelle l’industrie n’a pas encore été en mesure de répondre clairement.

Le procès a été déposé mardi devant le tribunal américain du district nord de Californie et prend la forme d'un recours collectif proposé. Une auteure nommée Elizabeth Lyon accuse Adobe d'utiliser des livres protégés par le droit d'auteur, y compris le sien, pour entraîner les modèles d'IA de l'entreprise, avec SlimLM au centre de l'affaire, sans autorisation. Selon la documentation judiciaire, ces travaux auraient fait partie du processus de formation de systèmes conçus pour répondre aux instructions humaines. Lyon prétend agir au nom d'autres ayants droit qui se retrouveraient dans une situation similaire.

Le grand débat sur les données qui entraînent l’IA

Pour comprendre pourquoi ce type de litiges se répète de plus en plus fréquemment, il convient de s’arrêter un instant sur le fonctionnement actuel de l’intelligence artificielle. Au-delà des applications visibles, des chatbots aux générateurs d'images, il existe des modèles sous-jacents qui constituent le cœur du système et apprennent à partir d'énormes volumes de données. De manière générale, davantage de données peuvent améliorer les performances, même si ce n’est pas le seul facteur. Le problème apparaît lorsque se pose la question clé de l’origine de ces informations et des conditions dans lesquelles elles ont été utilisées.

Le modèle indiqué dans le procès n'est pas Firefly, le système de création le plus connu d'Adobe, mais SlimLM, une famille de modèles de langage plus petits conçus pour des tâches spécifiques. Ces modèles sont conçus pour aider les utilisateurs avec les fonctions liées aux documents, notamment sur les appareils mobiles. Il ne s’agit pas d’une IA destinée à la génération créative à grande échelle, mais plutôt d’un système fonctionnant en arrière-plan. Cette différence est pertinente car elle montre que le débat sur les données de formation ne se limite pas aux applications les plus visibles.

Selon le procès, le conflit ne résiderait pas dans SlimLM en tant que produit final, mais dans les données utilisées lors de sa phase de formation. Adobe a expliqué que ces modèles ont été pré-entraînés avec SlimPajama-627B, un ensemble de données open source publié par Cerebras en juin 2023. Le document judiciaire maintient que SlimPajama dérive de RedPajama, un autre largement utilisé dans l'industrie, et que celui-ci intègre à son tour Books3, une collection massive de livres protégés par le droit d'auteur. Cette chaîne est celle qui, selon le plaignant, aurait permis l'inclusion d'œuvres sans autorisation.

Acrobate

Jusqu'à présent, le discours public d'Adobe sur l'intelligence artificielle s'articulait principalement autour de Firefly, un produit clairement identifié dans le respect des créateurs et de l'utilisation de contenus sous licence. La société a défendu que ces modèles avaient été formés avec du contenu sous licence, tel qu'Adobe Stock, et du matériel du domaine public, et a accompagné ce message de programmes de rémunération pour les collaborateurs d'Adobe Stock. La demande ne s'adresse cependant pas à ce front visible, mais, comme on dit, à SlimLM, un modèle plus discret, intégré aux tâches d'assistance et sans présence commerciale directe. Cette séparation est essentielle pour comprendre la véritable portée de l’affaire.

La procédure contre Adobe s’inscrit dans un contexte plus large de litiges aux États-Unis liés à la formation de modèles d’IA. Ces dernières années, des auteurs et d’autres titulaires de droits ont poursuivi en justice des entreprises technologiques telles que OpenAIo Anthropic, alléguant une utilisation non autorisée d’œuvres protégées. Certains de ces processus sont encore ouverts et d’autres ont abouti à des accords à plusieurs millions de dollars. Ce scénario explique pourquoi chaque nouveau cas est interprété comme une étape supplémentaire dans la délimitation juridique de l’usage des données en intelligence artificielle.

Les grandes technologies commencent à mettre en gage les bijoux de grand-mère pour l'IA : c'est un symptôme inquiétant

Pour l’instant, l’affaire en est à sa phase initiale et laisse de nombreuses inconnues ouvertes. Le plaignant demande une compensation financière non précisée et intente une action au nom d'autres victimes potentielles, tandis qu'Adobe n'a pas répondu à la demande de commentaires de Reuters. C’est le processus judiciaire qui déterminera si le procès aboutit, est déposé ou aboutit à un accord. Au-delà de son issue spécifique, le litige met une fois de plus l’accent sur une question qui reste en suspens : comment équilibrer les progrès de l’IA avec les droits de ceux qui créent le contenu dont elle apprend.

Images | Rubaitul Azad | Adobe

À Simseo | Gemini 3 Flash a dépassé GPT-5.2 Extra High dans plusieurs benchmarks : Google vient de changer les règles du modèle léger