L'algorithme probabiliste cible les fausses nouvelles des médias sociaux

L’algorithme probabiliste cible les fausses nouvelles des médias sociaux

Les fausses nouvelles sur les réseaux sociaux deviennent de plus en plus faciles à répartir et plus difficiles à détecter. C’est grâce à l’intelligence artificielle de plus en plus puissante (IA) et aux réduction des ressources de vérification des faits par les principales plateformes.

Ceci est particulièrement préoccupant lors des élections, lorsque les acteurs locaux et internationaux peuvent utiliser des images, du texte, de l’audio et du contenu vidéo pour diffuser une désinformation.

Cependant, tout comme l’IA et les algorithmes peuvent propager de fausses nouvelles, ils peuvent être utilisés pour le détecter. Les chercheurs de la Gina Cody School of Engineering and Computer Science de Concordia ont développé une nouvelle approche pour identifier les fausses nouvelles. Et ils disent qu’il pourra trouver des modèles cachés qui révèlent si un élément particulier est probablement faux ou non.

Le modèle, appelé SmoothDetector, intègre un algorithme probabiliste avec un réseau neuronal profond. Il est conçu pour capturer les incertitudes et les modèles clés dans les représentations latentes partagées des textes et des images dans un paramètre multimodal. Le modèle utilise des données de texte et d’image annotées de la plate-forme de médias sociaux basée aux États-Unis X et de Weibo basée en Chine pour apprendre. Les chercheurs envisagent actuellement des moyens d’intégrer éventuellement des fonctionnalités pour détecter également le faux contenu audio et vidéo, en tirant parti de chaque moyen pour contrer la désinformation.

« SmoothDetector est capable de découvrir des modèles complexes à partir de données annotées, mélangeant le pouvoir expressif de l’apprentissage en profondeur avec la capacité d’un algorithme probabiliste à quantifier l’incertitude, fournissant finalement une prédiction confiante sur l’authenticité d’un élément », explique Ph.D. candidat Akinlolu Ojo. Il décrit le modèle dans le journal Accès IEEE.

L’une des complexités que le modèle apprend est le ton. Le codage positionnel donne au modèle la capacité d’apprendre le sens d’un certain mot par rapport aux autres dans une phrase, lui donnant une cohérence à la phrase. La même technique est utilisée sur les images.

« L’innovation de notre modèle réside dans son approche probabiliste », explique Ojo.

Apprendre l’ambiguïté possible

SmoothDetector s’appuie sur des modèles multimodaux existants mais encore relativement nouveaux de la détection de fausses nouvelles, explique Ojo. Les modèles antérieurs ne pouvaient examiner qu’un seul mode à la fois – texte ou image ou audio ou vidéo – plutôt que tous les modes d’un post simultanément. Cela signifiait qu’un message avec un faux texte mais une photo précise pouvait être étiquetée comme un faux positif ou négatif.

Cela pourrait créer une confusion supplémentaire, en particulier en ce qui concerne les nouvelles, lorsque de grandes quantités d’informations sont générées rapidement et peuvent être contradictoires.

« Nous voulions capturer ces incertitudes pour nous assurer que nous ne faisions pas de jugement simple sur la question de savoir si quelque chose était faux ou réel », explique Ojo. « C’est pourquoi nous travaillons avec un modèle probabiliste. Il peut surveiller ou contrôler le jugement du modèle d’apprentissage en profondeur. Nous ne comptons pas seulement sur le modèle direct de l’information. »

SmoothDetector tire son nom du lissage de la distribution de probabilité d’un résultat: au lieu de décider directement qu’un contenu est faux ou réel, il évalue l’incertitude inhérente aux données et quantifie la probabilité de lisser la probabilité, offrant un jugement plus nuancé de l’authenticité d’un élément.

« Cela rend plus polyvalent de capturer des informations ou une corrélation positives et négatives », ajoute-t-il.

OJO dit que bien que plus de travail soit nécessaire pour rendre le modèle vraiment multimodal et capable d’analyser les données audio et visuelles, elle est transférable à d’autres plates-formes en plus de X et Weibo.

Nizar Bouguila, professeur au Concordia Institute for Information Systems Engineering, a contribué à ce document, avec le professeur adjoint Fatma Najar, Ph.D. 22, au John Jay College of Criminal Justice, avec les professeurs adjoints Nuha Zamzami, Ph.D. 20, et Hanen Himdi à l’Université de Jeddah en Arabie saoudite.