DALL·E 2023-01-13 12.59.28 – office workers strategy like Guttuso

News Media Alliance : des chatbots IA formés au contenu d’actualité

Alliance des médias d’informationun groupe représentant plus de 2 200 éditeurs américains, dont Le New York Times, affirme que les chatbots IA, tels que ChatGPT, utilisent des informations protégées par le droit d’auteur pour alimenter la technologie. Selon News Media Alliance, les développeurs de ces outils ne utilisation disproportionnée du contenu d’actualité.

Recherche sur l’utilisation du contenu d’actualité

Le 7 novembre 2023, News Media Alliance a publié une étude affirmant que les développeurs préfèrent utiliser des articles plutôt que du contenu générique en ligne pour former la technologie. De plus, les chatbots reproduisent des sections de certains articles dans leurs réponses.

Le groupe affirme que ces résultats démontrent que les sociétés d’IA violent la loi sur le droit d’auteur. Danielle Coffeyprésident-directeur général de News Media Alliance, a déclaré que ce problème existe depuis des années et que leet les entreprises technologiques comme Google ne rémunèrent pas suffisamment les agences de presse pour la diffusion de leur travail sur les services en ligne..

L’analyse des données utilisées par les modèles d’apprentissage

Il est impossible de savoir exactement quelles données sont introduites dans les grands modèles d’apprentissage, car beaucoup n’ont pas confirmé publiquement ce qui est utilisé.. Dans son analyse, News Media Alliance a comparé des ensembles de données publiques censés être utilisés pour former des modèles de langage populaires, qui sous-tendent les chatbots IA comme ChatGPT, avec un ensemble de données génériques et open source extrait du Web.

L’équipe a découvert que les ensembles de données organisés utilisaient du contenu d’actualité cinq à 100 fois plus que l’ensemble de données générique. Selon Coffey, ces résultats démontrent que ceux qui créent des modèles d’IA apprécient un contenu de qualité.

Les chatbots peuvent-ils remplacer le travail journalistique ?

Le rapport a également découvert des cas où les modèles reproduisaient directement le langage utilisé dans les articles de presse. Coffey a déclaré que cela montre que les copies du contenu des éditeurs sont conservées pour être utilisées par les chatbots, et que la production des chatbots est donc en concurrence avec les articles d’actualité.

En plus d’utiliser des articles pour former des modèles de discours, les responsables des médias ont exprimé un certain nombre de préoccupations concernant l’intelligence artificielle. Certains craignent que le trafic vers les sites d’information provenant des moteurs de recherche ne diminue si les chatbots deviennent le principal outil de recherche. Aussi, de nombreux professionnels des médias craignent d’être remplacés par l’intelligence artificielle.