Adobe Luciole 2

Adobe affirme que son IA a été formée sur des images autorisées. En fait, il a également utilisé le contenu de Midjourney

Nous sommes témoins de l’évolution de la course au développement de l’IA. Il s'agit d'un concours dans lequel il y a autant de propositions que de procès pour violation du droit d'auteur. Adobe voulait éviter tout type d'inconvénient au niveau de la garantie que sa famille de modèles d'IA avait été formée avec des images Adobe Stock, ainsi qu'avec du contenu sous licence ouverte et du contenu du domaine public.

Les fonctionnalités susmentionnées ont fait d'Adobe Firefly, l'outil de génération d'images de l'entreprise, une alternative sûre pour un usage commercial. Après tout, les logiciels Adobe sont utilisés par les créatifs du monde entier pour créer des pièces graphiques professionnelles. Ce que l’on ne savait pas, c’est qu’Adobe avait utilisé des images de concurrents comme Midjourney pour alimenter son modèle théoriquement plus éthique.

Adobe Firefly, formé avec Midjourney

Adobe a consacré des pages sur son site officiel où il compare Firefly à DALL·E, Stable Diffusion et Midjourney. Dans chacun d'eux, ils soulignent le pureté des données utilisées Pour s'entraîner. Cependant, comme le rapporte Bloomberg, la société a utilisé des images d'outils concurrents pour entraîner son modèle. En effet, Adobe Stock autorise depuis un certain temps les utilisateurs à obtenir une licence pour les images générées par l'IA.

Les conditions générales d’Adobe Stock exigent que les contributeurs de la plateforme disposent de tous les droits nécessaires pour obtenir une licence sur les images. Cela inclut le contenu généré par l’IA. Maintenant, si nous explorons attentivement la bibliothèque Adobe Stock, nous trouvons des images générées avec Midjourney et d'autres outils génératifs, outils qui, d'ailleurs, ont été poursuivis pour violation du droit d'auteur.

Nous sommes donc confrontés à un dilemme. L'outil qui cherche à se différencier de ses concurrents s'est nourri du contenu génératif de ses concurrents. Or, le panorama est complexe et présente plusieurs aspects. D’une part, Adobe reconnaît que «une petite partie» de l'ensemble de données Firefly comprend du matériel génératif provenant d'Adobe Stock, mais indique également que les images sont soumises à un processus garantissant qu'elles n'incluent pas de propriété intellectuelle.

Adobe Luciole 2

Bloomberg ajoute que la stratégie menée par Adobe a généré des désaccords internes parmi ses salariés. Certains ont même suggéré qu'Adobe suspende pendant un certain temps sa plateforme d'imagerie, même si des sources non officielles consultées par les médias indiquent qu'il n'y a aucun projet à cet égard. L'entreprise a changé sa position concernant l'utilisation de contenu génératif pour former ses modèles d'IA.

En juin de l'année dernière, Adobe a annoncé que la version finale d'Adobe Firefly n'inclurait pas de contenu génératif provenant d'autres plates-formes. Trois mois plus tard, en septembre, l'outil sortait de la version bêta et un «Bonus luciole» parmi les contributeurs d'Adobe Stock. Enfin, selon Mat Hayward de la communauté Adobe Stock, l'entreprise a décidé d'inclure du contenu génératif dans la version commerciale de Firefly car « cela améliore le modèle de formation ».

Les données pour entraîner l’IA, une denrée rare

Une réalité à prendre en compte est que les entreprises en compétition pour diriger le développement de l’IA dévorent littéralement les données disponibles sur le Web pour former les modèles qui alimentent leurs produits. Et, même si nous pouvons considérer le Web comme quelque chose d’immense et difficile à dimensionner, l’essor de l’IA le rend moins important que nous le pensions, car une grande partie du contenu publié n’est pas adapté à la formation de modèles d’IA de qualité.

Si vous utilisez ChatGPT Plus, les réponses que vous obtiendrez seront moins pompeuses qu'avant.  La faute à GPT-4 Turbo

Les géants de la technologie sont contraints de rechercher des alternatives pour former leurs modèles. Selon le New York Times, OpenAI a transcrit un million d'heures de YouTube pour former le prodigieux GPT-4, un modèle qui alimente des produits comme ChatGPT Plus et Microsoft Copilot. La même entreprise aurait également utilisé la plateforme vidéo de Google pour former, en partie, le modèle Sora, ce dont, si c'était vrai, YouTube ne serait pas content.

Images | Adobe (1, 2)

À Simseo | DALL-E travaille avec des images de créateurs qui ne reçoivent rien en retour : ce que dit le droit d'auteur sur l'IA

À Simseo | L’AI Pin a atteint ses premiers utilisateurs. Et leurs conclusions ne sont pas du tout encourageantes.