maintenant confronté à une vague de poursuites
OpenAI continue d'accumuler des poursuites pour avoir entraîné ses modèles d'intelligence artificielle avec du contenu protégé par droit d'auteur. Ces derniers mois, des médias américains comme The Intercept et The New York Times ont accusé la société dirigée par Sam Altman d'utiliser des articles de sa propriété sans autorisation. Aujourd’hui, la deuxième plus grande société de presse du pays a également décidé d’engager des poursuites judiciaires contre l’entreprise technologique.
Huit publications regroupées sous l'égide du géant Alden Global ont porté plainte ce mardi devant le tribunal fédéral de New York contre OpenAI et son principal partenaire stratégique, Microsoft. Le texte juridique accuse les entreprises susmentionnées d’alimenter leurs produits d’IA générative avec des « millions » d’articles protégés par le droit d’auteur et exige une compensation financière, mais pas avant que l’affaire ne soit jugée par un jury.
ChatGPT et le modèle économique des journaux exigeants
Le procès des journaux Alden allègue que ChatGPT et Copilot ont affiché le texte de l'article derrière un paywall. Selon les plaignants, cela a entraîné au moins deux problèmes : d'une part, la source de l'information n'était pas toujours citée ; En revanche, de nombreux lecteurs ils ont arrêté de payer vos abonnements. Les publications affirment que les chatbots susmentionnés ont eu un impact négatif sur leur modèle économique.
Selon Axios, le procès fait également référence aux « hallucinations » des chatbots. Comme nous le savons, l’un des gros problèmes de l’état actuel de l’IA générative est qu’elle invente des choses. En ce sens, le document juridique indique que ChatGPT a inventé que le Denver Post avait publié sur la recherche médicale liée au tabagisme peut être un remède contre l'asthme, un sujet qui, prétendent-ils, n'a jamais existé dans le journal.
La plainte, déposée par deux des cabinets d'avocats également choisis par le Times, comprend actuellement le New York Daily News, le Chicago Tribune, Orlando Sentinel, le South Florida Sun Sentinel, le San Jose Mercury News, le Denver Post, l'Orange County Register et le St. Presse Paul Pioneer. Ce sont huit des soixante points qu'Alden Global Capital contrôle, il est donc également possible que certaines de ses autres publications soient ajoutées à l'avenir.
Former des modèles d’IA, un défi de plus en plus compliqué
Nous assistons à l’énorme croissance de l’industrie de l’IA, mais aussi aux défis qui se profilent à l’horizon. Les chatbots que nous connaissons presque tous disposent d’informations sur un large éventail de sujets. Pour y parvenir, les entreprises qui les ont développés ont dû recourir à une énorme quantité de données. Tout semble indiquer que certaines pièces relèvent du domaine public, tandis que d'autres sont encore protégées par le droit d'auteur.
Il convient de noter que depuis qu'OpenAI a adopté une approche plus commerciale, s'éloignant de la philosophie ouverte avec laquelle elle a été fondée, de nombreux détails de ses technologies ils sont gardés secrets. La vérité est que nous ne savons pas avec quelles données exactes, par exemple, le prodigieux GPT-4 a été entraîné. Cependant, l'entreprise a reconnu devant le Parlement britannique qu'« il serait impossible de former les principaux modèles d'IA actuels sans utiliser de matériel protégé par le droit d'auteur ».
Il faudra attendre pour connaître l’issue des procédures judiciaires actuellement en cours. Pendant ce temps, OpenAI a commencé à nouer des alliances avec divers groupes d'édition pour pouvoir accéder à leur contenu. L’objectif ici est clair : garantir une certaine quantité de données pour pouvoir entraîner vos modèles. Parmi les accords les plus récents, on trouve Associated Press (AP), Axel Springer, Prisa et Le Monde.
Images | Fil de fer | Solén Feyissa | Emiliano Vittoriosi
À Simseo | ChatGPT invente des données et c'est illégal en Europe. Une organisation a donc décidé de régler le problème en intentant une action en justice.