Wikipédia a un problème avec les faux articles. Maintenant, il veut le résoudre avec l'intelligence artificielle

Wikipédia, l’encyclopédie gratuite et collaborative utilisée par des millions de personnes, peut contenir de fausses informations, soit par inadvertance de ceux qui l’éditent, soit par des mouvements intentionnels. Sans aller plus loin, nous pouvons citer le cas de la femme chinoise qui pendant plus d’une décennie a écrit des articles trompeurs sur la Russie, faisant croire à de nombreux utilisateurs qu’il s’agissait d’informations réelles.

La Wikimedia Foundation, l’organisation à but non lucratif à l’origine de l’encyclopédie numérique, reconnaît cette situation. Bien qu’il dispose de mécanismes de vérification, le défi d’éviter les erreurs augmente pour les bénévoles, qui considèrent comme plus de 17 000 nouveaux articles sont ajoutés chaque mois. Désormais, un modèle d’intelligence artificielle (IA) développé par Meta pourrait les aider dans leurs tâches.

Sphere, une IA pour Wikipédia

L’un des outils dont disposent les éditeurs de Wikipédia pour déterminer si les informations contenues dans un article sont exactes est sources ou références répertoriés en bas de la page. Le problème est qu’à mesure que l’encyclopédie grandit, il devient plus complexe de les vérifier manuellement. Et si nous pouvions utiliser l’IA pour travailler avec cette énorme quantité d’informations et aider les éditeurs ?

Meta pense que c’est possible. En ce sens, il a développé un système qui permet de consulter automatiquement des centaines de milliers de références en même temps. Selon l’entreprise, cette solution, connue sous le nom de « Sphere », repose sur deux piliers principaux : un algorithme formé avec plus de 4 millions d’extraits de texte Wikipédia, et un ensemble de données alimenté par des informations provenant de 134 millions de pages Web.

Pour vérifier les références d’un nouvel article, Sphere effectue plusieurs étapes. La première est une recherche au sein d’un index qui classe les informations pour éviter de perdre du temps à analyser des données qui ne correspondent pas au sujet en question. Lorsque le système trouve un document qui pourrait potentiellement être cité comme source, il en extrait le passage le plus pertinent et le traite à travers un modèle de classification, qui compare le nouveau texte à la citation originale.

La vérité est que les modifications ne seront pas apportées automatiquement dans l’article. Si le système détecte une référence incohérente, les alternatives qu’il juge les plus appropriées sera présenté à une personne qui sera chargée d’approuver les changements. Meta dit que Sphere pourra travailler dans plusieurs langues et non seulement traiter du texte, mais aussi des images, des vidéos et des tableaux de données.

Bien entendu, il faudra patienter pour voir cette solution en action. La société affirme que le système est encore en phase de recherche et n’est pas encore utilisé sur le contenu de Wikipédia. Cependant, il est convaincu que plus tard, cela allégera le fardeau des éditeurs, non seulement de la plus grande encyclopédie numérique au monde, mais d’autres projets qui nécessitent la vérification d’énormes quantités de données.

Télécharger Wikipédia : comment télécharger des articles ou TOUT Wikipédia pour le lire hors ligne

Il convient de noter que Sphere est un projet open source, qui permettra à la communauté d’examiner le fonctionnement des algorithmes. En revanche, l’entreprise dirigée par Mark Zuckerberg n’a pas révélé si elle envisageait de mettre en place ce système sur ses réseaux sociaux Facebook et Instagram pour éviter les fausses nouvelles. Suite à la polémique autour de la désinformation, Meta avait promis d’investir dans de nouveaux outils afin que les utilisateurs de ses plateformes sachent à quelles informations se fier.

Quant à l’intelligence artificielle, on peut dire que c’est une discipline très prometteuse. Non seulement cela nous permet d’augmenter les possibilités de conduite autonome, de créer des visages photoréalistes, des images à partir de texte et de gagner aux échecs, pour ne citer que quelques exemples. Cela pourrait également aider à faire de Wikipédia une page d’informations beaucoup plus précise.. Ça va marcher? Avec le temps nous le saurons.

Images | Obéron Copeland (Unsplash) | objectif IA

À Simseo | Le Wikipédia payant est déjà une réalité : c’est ce que des entreprises comme Google ou Amazon vont facturer pour l’utilisation de vos données