Reddit poursuit AI géant anthropique sur l'utilisation du contenu

Social Media Outlet Reddit a déposé un procès contre la société de renseignement artificiel Anthropic, accusant la startup de gratter illégalement des millions de commentaires des utilisateurs pour former son chatbot Claude sans autorisation ni compensation.

Le procès dans un tribunal d'État de Californie représente le dernier front de la bataille croissante entre les fournisseurs de contenu et les sociétés d'IA sur l'utilisation des données pour former des modèles linguistiques de plus en plus sophistiqués qui alimentent la révolution générative de l'IA.

Anthropic, d'une valeur de 61,5 milliards de dollars et fortement soutenu par Amazon, a été fondée en 2021 par d'anciens dirigeants d'Openai, le créateur de Chatgpt.

La société, connue pour ses modèles Claude Chatbot et IA, se positionne comme axée sur la sécurité de l'IA et le développement responsable.

« Cette affaire concerne les deux visages de l'anthropique: le visage public qui tente de s'introduire dans la conscience du consommateur avec des revendications de justice et du respect des frontières et de la loi, et le visage privé qui ignore toutes les règles qui interfèrent avec ses tentatives pour faire avancer ses poches », a indiqué la poursuite.

Selon la plainte, Anthropic forment ses modèles sur le contenu Reddit depuis au moins décembre 2021, avec le PDG Dario Amodei co-réduisant des articles de recherche qui ont spécifiquement identifié un contenu de haute qualité pour la formation des données.

Le procès allègue que malgré les allégations publiques d'Anthropic selon lesquelles elle avait empêché ses robots d'accéder à Reddit, les systèmes automatisés de la société ont continué à récolter les serveurs de Reddit plus de 100 000 fois au cours des mois suivants.

Reddit demande des dommages-intérêts monétaires et une injonction du tribunal pour forcer anthropic à se conformer à ses conditions de contrat d'utilisateur. La société a demandé un procès devant jury.

Dans un e-mail à l'AFP, Anthropic a déclaré « nous ne sommes pas d'accord avec les réclamations de Reddit et nous nous défendons vigoureusement ».

Reddit a conclu des accords de licence avec d'autres géants de l'IA, notamment Google et OpenAI, qui permettent à ces entreprises d'utiliser le contenu Reddit selon des conditions qui protègent la confidentialité des utilisateurs et apportent une compensation à la plate-forme.

Ces transactions ont contribué à relancer le cours de l'action de Reddit depuis son être devenu public en 2024.

Les actions de Reddit ont augmenté de plus de 6% mercredi à la suite de la nouvelle du procès.

Les musiciens, les auteurs de livres, les artistes visuels et les publications de nouvelles ont poursuivi les différentes sociétés d'IA qui ont utilisé leurs données sans autorisation ni paiement.

Les entreprises d'IA défendent généralement leurs pratiques en réclamant une utilisation équitable, faisant valoir que la formation de l'IA sur de grands ensembles de données modifie fondamentalement le contenu d'origine et est nécessaire à l'innovation.

Bien que la plupart de ces poursuites soient encore à début, leurs résultats pourraient avoir un effet profond sur la forme de l'industrie de l'IA.