Wikipedia Weathers AI Défis mais fait face

Wikipedia Weathers AI Défis mais fait face

Chatgpt n'a pas diminué l'activité sur la plus grande encyclopédie en ligne au monde, mais les grattoirs de données AI et l'influence de modèles de grande langue jettent toujours une ombre sur son avenir, suggère la recherche.

Les travaux du King's College de Londres ont examiné les modifications des vues agrégées de Wikipedia en 12 langues, six de ces langues étant ouvertes à Chatgpt et aux autres non. Les chercheurs n'ont trouvé aucun signe d'utilisation réduite depuis l'introduction du modèle d'IA en 2022.

Cependant, ils ont noté une croissance ralentie de l'utilisation dans les langues où le chatgpt était actif par rapport à ceux où il ne l'était pas, suggérant que le programme a eu un impact limité.

En 2021, un rédacteur de longue date de Wikipedia a tristement soulevé l'idée de la «mort» de la plate-forme en raison de l'influence de l'IA. Dans ce scénario, des chatbots comme GPT supplanteraient Wikipedia comme principale source d'informations en ligne, en remplacement des éditeurs humains par des aperçus générés par l'IA et en polluant la sphère d'information par des hallucinations bien documentées.

Certains dans l'industrie craignent que cela ne se passe avec le trafic Web mondial vers des sites de référence, dont Wikipedia est la plus importante, en baisse de 15% entre juin 2024 et juin 2025.

L'article, publié dans Intelligence collective ACMréfute cette forme de «mort». Cependant, les chercheurs suggèrent que l'augmentation du coût de la gestion des serveurs en raison de l'afflux de grattoirs de données d'IA utilisant Wikipedia pour former des modèles d'IA augmente rapidement, ce qui, selon les modérateurs du site, pourrait toujours menacer la structure actuelle de la plate-forme.

Le professeur Elena Simperl, professeur d'informatique chez King's et codirecteur du King's Institute for Artificial Intelligence, a déclaré: « Notre travail n'a pas confirmé le scénario le plus alarmiste, mais nous ne sommes pas encore hors des bois. En utilisant les données de Wikipedia dans les recherches sur le Web, mais pas à la crédibilité des sources, siphonne le trafic Web tout en empruntant le travail de la plate-forme.

« Pour des services gratuits comme celui-ci, personne ne s'arrête pour se demander comment il est payé – et maintenant Wikipedia doit prendre la décision difficile de la répartition des ressources limitées pour faire face à cela. C'est vital en tant que communauté que nous prenons des mesures pour protéger cette plate-forme importante, et nous espérons transformer notre travail en un outil de surveillance où la communauté peut suivre comment l'IA a un impact sur Wikipedia. »

« En fin de compte, nous avons besoin d'un nouveau contrat social entre les entreprises d'IA et les prestataires de données de haute qualité comme Wikipedia où ils conservent plus de pouvoir sur leur matériel, tout en permettant à leurs données d'être utilisées comme matériel de formation », explique Postdoc et le premier auteur Neal Reeves.

Wikipedia est la plus grande encyclopédie en ligne, composée de plus de 6,6 millions d'articles en 292 langues à partir de 2023, et est une source majeure d'informations gratuites pour les moteurs de recherche et de nombreuses communautés en ligne. C'est particulièrement le cas pour les langues en dehors de l'Europe et de l'Asie de l'Est, qui dépendent fortement de Wikipedia pour l'accès à des informations disponibles gratuitement.

Reeves suggère qu'il existe des étapes disponibles pour protéger Wikipedia. «En fin de compte, nous avons besoin d'un nouveau contrat social entre les entreprises d'IA et les prestataires de données de haute qualité comme Wikipedia où ils conservent plus de pouvoir sur leur matériel, tout en permettant à leurs données d'être utilisées à des fins de formation.

« La collaboration, comme celle observée dans des programmes comme MLCommons, est nécessaire pour traverser l'allée et s'assurer que la prochaine génération de modèles d'IA est bien formée, mais d'une manière qui ne détruit pas l'une des plus grandes ressources d'Internet. »

À l'avenir, l'équipe espère utiliser les commentaires qu'ils ont reçus de la communauté Wikipedia pour développer un outil de surveillance ouvertement disponible que les utilisateurs du monde entier peuvent déployer pour exécuter des analyses sur l'état de Wikipedia avec des méthodes analytiques plus rigoureuses.