Reddit convient à Anthropic: "Il a exploité nos données pour former l'IA sans autorisation"

Reddit a déposé une cause contre Anthropiqueaccusant le démarrage de l'intelligence artificielle d'avoir utilisé des données sociales de manière non autorisée pour former leurs modèles d'IA, sans avoir conclu un accord de licence. La plainte a été déposée le 4 juin à la California Superior Court de San Francisco. Reddit stipule que l'utilisation du contenu de la plate-forme par anthropique à des fins commerciales est illégale et constitue une violation des conditions d'utilisation du site. « Nous ne tolérerons pas ce qu'une entité orientée vers le profit en tant qu'anthropique exploite commercialement le contenu de Reddit pour gagner des milliards de dollars, sans aucun revenu de revenu ou de respect pour leur vie privée », a-t-il déclaré Ben LeeDirecteur juridique de Reddit, dans une déclaration TechCrunch.

La première technologie géante défie légalement une entreprise à

Avec cette action en justice, Reddit devient La première grande plate-forme technologique pour contester officiellement les pratiques de formation des modèles d'IA d'une startup. La cause est combinée à une série croissante d'actions en justice similaires promues par des éditeurs, des artistes et des auteurs.

Le New York Times Il a poursuivi Openai et Microsoft pour utiliser ses articles pour des modèles de formation sans compensation ni autorisation. De même, Sarah Silverman et d'autres auteurs ont poursuivi Moitié Pour l'utilisation de leurs livres, tandis que les éditeurs musicaux et les artistes ont éloigné des contestations similaires contre les startups qui se développent génératives pour l'audio, les vidéos et les images.

Reddit contre Anthropic: négociations manquées, grattage massif et violations répétées

Reddit affirme qu'après avoir clairement communiqué à Anthropic qu'il n'avait aucune autorisation à utiliser ou « Ferraille » Le contenu de la plate-forme, la startup s'est poursuivie. Selon la plainte, Anthropic aurait ignoré les instructions contenues dans les fichiers robots.txt – Standard qui indique les robots automatiques de ne pas ramper dans les sites – et aurait fait plus de 100 000 accès non autorisés en 2024.

« Les entreprises AI ne devraient pas avoir l'autorisation de collecter des informations et du contenu des personnes sans limites claires sur la façon dont ces données peuvent être utilisées », a ajouté Ben Lee.

La plainte indique également qu'Anthropic refuserait de conclure un accord de licence et qu'il serait injustement enrichi aux dépenses reddit.

Accords sélectifs avec Openai et Google

Reddit a plutôt resserré les accords commerciaux avec Openai Et Googlequi prévoit l'utilisation du contenu de la plate-forme pour la formation des modèles AI et l'affichage des publications Reddit dans les réponses de leurs chatbots respectifs. Dans ces cas, Reddit déclare qu'il a fourni des clauses spécifiques pour protéger la confidentialité des utilisateurs.

Il faut se rappeler que Sam Altman, PDG d'Openai, détient une part de 8,7% dans Reddit Et dans le passé, il a été membre du conseil d'administration de la plate-forme.

Réponse d'Anthropic: « Nous nous défendrons avec force »

Un porte-parole d'Anthropic, demandé par TechCrunchIl a répondu: « Nous ne sommes pas d'accord avec les déclarations de Reddit et nous nous défendrons fortement ».

La cause fait partie d'une atmosphère de tension croissante dans le secteur de l'intelligence artificielle, où les entreprises ont de plus en plus faim de données pour améliorer les performances de leurs modèles. Cependant, avec l'augmentation des litiges juridiques et la fermeture progressive des sources de données par les plateformes numériques, la disponibilité du contenu à utiliser sans licence diminue rapidement.

Reddit demande une indemnisation et une injonction

Avec la cause, Reddit nécessite des dommages compensatoires et le retour des bénéfices obtenus par anthropique par l'utilisation de son contenu. De plus, la plate-forme demande une injonction qui interdit à Anthropic de continuer à utiliser le contenu Reddit à l'avenir.

Si la cause est réussie, elle pourrait marquer un précédent important dans la réglementation de la relation entre les plateformes en ligne, l'IA des entreprises et l'utilisation éthique des données numériques.