Les outils de recherche d'IA et les chatbots peuvent rendre les informations moins visibles et moins fiables

Les outils de recherche d'IA et les chatbots peuvent rendre les informations moins visibles et moins fiables

Il existe de plus en plus de preuves montrant que les nouveaux outils de recherche Internet basés sur l’IA générative fournis par OpenAI, Google et Microsoft peuvent augmenter le risque de renvoyer des informations fausses, trompeuses ou partiellement correctes.

Malgré les implications de cette situation pour l'industrie de l'information et pour une démocratie informée, le gouvernement néo-zélandais a décidé de laisser les considérations relatives à l'IA en dehors de ses plans visant à relancer le projet de loi sur la négociation équitable de l'information numérique du gouvernement précédent.

La loi proposée obligera Google et Meta (qui gère Facebook et Instagram) à payer les médias pour leurs contenus. Si de nombreux médias locaux reçoivent de l'argent de Google, ils ne reçoivent aucun paiement de Meta.

Le ministre des Médias et des Communications, Paul Goldsmith, a déclaré que le projet de loi proposé comporterait quelques amendements, mais qu'ils ne concerneraient pas le rôle croissant de l'IA générative dans la recherche d'informations. La « vaste question de l'IA » serait examinée plus tard, a-t-il déclaré.

Toutefois, le projet de loi donnera au ministre le pouvoir de décider quelles entreprises seront incluses dans une nouvelle loi, ouvrant potentiellement la porte à l'arrivée de sociétés comme Microsoft et OpenAI à la table des négociations.

Comment les entreprises de presse réagissent-elles ?

Les chatbots basés sur l'IA, tels que Gemini de Google, Copilot de Microsoft et ChatGPT d'OpenAI, répondent aux questions des utilisateurs en fournissant des réponses basées sur des informations « extraites » d'Internet, notamment des sites de médias d'information. Ils utilisent également le contenu des actualités, ou tout autre contenu qu'ils peuvent trouver, pour « entraîner » leurs modèles d'IA.

Alors que les entreprises d’IA peinent à trouver suffisamment de données pour réaliser cette formation, elles concluent des accords avec des sociétés de presse pour utiliser leur contenu, y compris leurs archives, afin d’alimenter leurs modèles.

Il n’est donc pas surprenant que de nombreuses grandes entreprises de presse, dont News Corp, The Financial Times (propriété de Nikkei) et l’allemand Axel Springer, aient signé des accords commerciaux pour leur contenu avec des sociétés d’IA.

D'un autre côté, des entreprises comme le New York Times et Alden Global Capital (le deuxième plus grand propriétaire de journaux aux États-Unis) ont adopté une approche différente. Elles poursuivent Microsoft et OpenAI pour « utilisation illégale d'articles de presse pour alimenter leurs chatbots IA ».

Alden affirme qu'OpenAI et Microsoft utilisent « des millions d'articles protégés par le droit d'auteur sans autorisation et les utilisent pour former et alimenter leurs produits d'IA générative ».

En 2023, le principal éditeur de presse néo-zélandais Stuff a interdit à ChatGPT d'utiliser ses articles pour alimenter ses modèles logiciels. Depuis lors, mes nouvelles recherches montrent que le contenu d'actualité de Stuff a également perdu en visibilité dans les recherches de Google et de Microsoft.

La diversité des informations diminue

J'ai analysé ce que les moteurs de recherche de Microsoft et de Google et leurs chatbots respectifs, Copilot et Gemini, proposent comme actualités.

En général, les moteurs de recherche renvoient des résultats basés sur la requête d'un utilisateur, en les reliant à des informations. Les chatbots utilisent de grands modèles de langage pour créer des réponses en récupérant des données à partir de sources, souvent sans aucun lien vers des informations.

L'étude a recueilli trois mois de données en 2023, puis à nouveau en 2024. Les moteurs de recherche ont été invités à proposer « les principales actualités en Nouvelle-Zélande aujourd'hui », et les chatbots ont été invités à fournir des liens et des sources vers des articles d'actualité.

Les résultats ont montré que la diversité des informations a diminué dans les recherches Google et Microsoft. Alors que les deux moteurs de recherche proposaient des informations provenant de médias traditionnels, la catégorie « autres sources » a connu une croissance spectaculaire entre 2023 et 2024.

Les sources d'informations proposées par ces moteurs de recherche basés sur l'IA sont inquiétantes. Ils renvoient de plus en plus vers des sources aléatoires et non informatives, telles que des forums sectoriels et des communiqués de presse.

De plus, les chatbots Google Gemini et Microsoft Copilot ont présenté d’anciennes histoires comme principales nouvelles du jour, n’ont pas fourni de liens vers les articles d’actualité spécifiques et n’ont donné aucune source dans les réponses qu’ils ont fournies.

Après avoir été interrogés sur les principales actualités en Nouvelle-Zélande aujourd'hui, les moteurs de recherche ont été interrogés : pouvez-vous donner des sources pour ces articles ? Cette réponse de Google Gemini était représentative des réponses :

« Je suis un grand modèle de langage et je suis capable de communiquer et de générer un texte de type humain en réponse à un large éventail d'invites et de questions. Puis-je faire autre chose pour vous aider avec cette demande ? »

À mesure que davantage de données sont intégrées aux moteurs de recherche et aux chatbots basés sur l’IA, ces derniers pourraient devenir plus précis. Mais d’ici là, les utilisateurs doivent se méfier de la fiabilité ou de l’indépendance des informations obtenues de cette manière.

Démocratie, actualité et IA

Les relations avec les entreprises d'IA ont placé les médias dans une situation difficile. S'ils ne concluent pas d'accords, ils risquent de perdre des revenus supplémentaires potentiels. S'ils le font, rien ne garantit que leur contenu apparaîtra dans la recherche générative par l'IA ou dans les chatbots.

En mai de cette année, par exemple, Google a confirmé que son moteur de recherche offrirait plus de réponses IA que de liens vers des sites Web. Cela signifie qu'il fournira des réponses IA détaillées aux invites des utilisateurs et des résumés instantanés sans lien vers des sources d'information.

Si les liens disparaissent des réponses de recherche générées par l'IA, cela signifie potentiellement que Google et d'autres fournisseurs n'auront pas besoin de payer les sociétés de presse pour les extraits et les liens qu'ils utilisent dans leurs services. Cela pourrait avoir des conséquences sur le projet de loi sur la négociation équitable de l'information numérique, qui a été relancé.

D’un autre côté, les fournisseurs d’IA paient déjà certaines sociétés de presse pour leur contenu actuel et archivé afin de former leurs chatbots, ce qui pourrait conduire à de meilleurs résultats de recherche.

La manière dont tout cela se déroulera aura des conséquences sur la démocratie autant que sur les revenus des médias, ce que mes recherches en cours visent à étudier.

Cet article est republié par The Conversation sous licence Creative Commons. Lire l'article original.La conversation