Craignant un « pillage », les médias bloquent un bot OpenAI
Un nombre croissant de médias bloquent un outil d’analyse de pages Web utilisé par le créateur de ChatGPT, OpenAI, pour améliorer ses modèles d’intelligence artificielle.
Le New York Times, CNN, la chaîne australienne ABC et les agences de presse Reuters et Bloomberg ont pris des mesures pour contrecarrer GPTBot, un robot d’exploration de sites Web lancé le 8 août.
Ils ont été suivis par les agences de presse françaises dont France 24, RFI, Mediapart, Radio France et TF1.
« Il y a une chose qui ne tiendra pas : c’est le pillage non autorisé des contenus », a déclaré lundi la présidente de Radio France, Sibyle Veil, lors d’une conférence de presse.
Près de 10 % des 1 000 principaux sites Web au monde ont bloqué l’accès à GPTBot deux semaines seulement après son lancement, selon le système de suivi du plagiat Originality.ai.
Ils incluent Amazon.com, Wikihow.com, Quora.com et Shutterstock. Originality.ai a déclaré qu’il s’attend à ce que la liste augmente de cinq pour cent par semaine.
Sur son site Web, OpenAI indique que « permettre à GPTBot d’accéder à votre site peut aider les modèles d’IA à devenir plus précis et à améliorer leurs capacités générales et leur sécurité ».
Mais la startup californienne fournit également des instructions sur la manière de bloquer le bot.
« Il n’y a aucune raison pour qu’ils viennent découvrir nos contenus sans rémunération », a déclaré à l’AFP Laurent Frisch, directeur de la stratégie numérique et innovation de Radio France.
Rémunération équitable
Les outils d’IA tels que le chatbot ChatGPT et les générateurs d’images DALL-E 2, Stable Diffusion et Midjourney ont explosé en popularité l’année dernière grâce à leur capacité à générer une richesse de contenu à partir de simples invites textuelles.
Cependant, les entreprises à l’origine de ces outils, notamment OpenAI et Stability AI, font déjà face à des poursuites judiciaires de la part d’artistes, d’auteurs et d’autres personnes affirmant que leur travail a été volé.
« Assez d’être pillés par ces sociétés qui font des profits sur notre production », a ajouté Vincent Fleury, directeur de l’espace numérique à France Médias Monde, maison mère de France 24 et RFI.
Les responsables des médias français ont également exprimé leur inquiétude quant au fait que leur contenu soit associé à de fausses informations.
Ils ont déclaré que des discussions étaient nécessaires avec OpenAI et d’autres groupes d’IA générative.
« Les médias doivent être rémunérés équitablement. Notre souhait est d’obtenir des accords de licence et de paiement », a déclaré Bertrand Gie, directeur du pôle information du journal Le Figaro et président du Groupement des éditeurs de services en ligne.
« Maintenir la confiance du public »
L’agence de presse américaine Associated Press a conclu en juillet un accord avec OpenAI autorisant la startup à exploiter ses archives remontant à 1985 en échange d’un accès à sa technologie et à son expertise en IA.
OpenAI a également engagé 5 millions de dollars pour soutenir l’expansion de l’American Journalism Project, une organisation qui soutient les médias locaux.
Il a également offert à l’organisation à but non lucratif jusqu’à 5 millions de dollars de crédits pour aider les organisations à évaluer et à déployer des technologies d’IA.
Un consortium de médias, dont l’AFP, l’Associated Press et Gannett/US Today, a publié début août une lettre ouverte affirmant que les entreprises d’IA doivent demander l’autorisation avant d’utiliser du texte et des images protégées par le droit d’auteur pour générer du contenu.
Les organisations ont déclaré que, tout en soutenant le déploiement responsable de la technologie de l’IA générative, « un cadre juridique doit être développé pour protéger le contenu qui alimente les applications d’IA ainsi que pour maintenir la confiance du public dans les médias qui promeuvent les faits et alimentent nos démocraties ».