Un nouvel outil mis au point à l’Université Concordia s’attaque au problème des fausses nouvelles dans les médias sociaux

Les fausses nouvelles dans les médias sociaux sont de plus en plus faciles à diffuser et difficiles à détecter. Ce phénomène est dû à une intelligence artificielle (IA) toujours plus puissante et à la réduction des ressources consacrées à la vérification des faits par les principales plateformes.
La situation est particulièrement préoccupante en période d’élections, lorsque des acteurs locaux et internationaux peuvent recourir à des images, à des textes ainsi qu’à des contenus audio et vidéo pour répandre de fausses informations.
Toutefois, si l’IA et les algorithmes peuvent propager les fausses nouvelles, ils peuvent aussi servir à les détecter. Des chercheurs de l’École de génie et d’informatique Gina-Cody de l’Université Concordia ont ainsi mis au point une nouvelle méthode d’identification des fausses nouvelles. Selon eux, cette approche permettra de déceler des motifs cachés qui révèlent si une nouvelle particulière est susceptible d’être fausse ou non.
Baptisé SmoothDetector, l’outil intègre un algorithme probabiliste et un réseau neuronal profond. Il est conçu pour repérer les incertitudes et les motifs clés dans les représentations latentes partagées des textes et des images en contexte multimodal. L’outil apprend à partir de textes et d’images annotés provenant de la plateforme de médias sociaux X, basée aux États-Unis, et du réseau Weibo, basé en Chine. Les chercheurs étudient actuellement les moyens d’intégrer un jour des fonctionnalités permettant de détecter aussi les faux contenus audio et vidéo, afin de tirer parti de tous les supports pour contrer la mésinformation.
« SmoothDetector est capable de découvrir des motifs complexes à partir de données annotées, en combinant la puissance expressive de l’apprentissage profond et la capacité des algorithmes probabilistes à quantifier l’incertitude, pour finalement fournir des prédictions fiables sur l’authenticité d’une nouvelle », explique Akinlolu Ojo. Le candidat au doctorat décrit cette innovation dans la revue IEEE Access.
L’une des complexités que l’outil assimile est le ton. Le codage positionnel permet à l’outil d’apprendre la signification d’un certain mot par rapport à d’autres dans une phrase, ce qui assure la cohérence de celle-ci. La même technique est utilisée pour les images.
« L’innovation de notre modèle réside dans son approche probabiliste », souligne M. Ojo.

Saisir l’ambiguïté possible
SmoothDetector s’appuie sur des modèles multimodaux existants – mais encore relativement nouveaux – de détection des fausses nouvelles, selon Akinlolu Ojo. Les modèles précédents ne pouvaient examiner qu’un seul mode à la fois – texte, image, audio ou vidéo – et non tous les modes d’un message simultanément. Cela signifiait qu’un message contenant un faux texte, mais une photo exacte, pouvait être qualifié de faux positif ou négatif.
Cette situation ajoutait à la confusion, notamment en ce qui concerne les nouvelles de dernière heure, lorsque de grandes quantités d’informations sont générées rapidement et peuvent s’avérer contradictoires.
« Nous voulions tenir compte de ces incertitudes afin de ne pas nous contenter d’un simple jugement sur le caractère réel ou fictif d’une nouvelle, explique M. Ojo. C’est pourquoi nous travaillons avec un modèle probabiliste qui peut surveiller ou contrôler le jugement du modèle d’apprentissage profond. Nous ne nous basons pas uniquement sur le motif direct d’une information. »
SmoothDetector tire son nom du lissage de la distribution de probabilité d’un résultat : au lieu de décider directement si un contenu est vrai ou faux, l’outil évalue l’incertitude inhérente aux données et quantifie la vraisemblance pour lisser la probabilité, offrant ainsi un jugement plus nuancé sur l’authenticité d’une nouvelle.
« Cela rend l’outil plus polyvalent pour saisir les informations positives et négatives ou les corrélations », ajoute Akinlolu Ojo.
Selon le doctorant, bien que des travaux supplémentaires soient nécessaires pour rendre l’outil véritablement multimodal et capable d’analyser des données audio et vidéo, il est transférable à d’autres plateformes au-delà de X et Weibo.
Nizar Bouguila, professeur à l’Institut d’ingénierie des systèmes d’information de l’Université Concordia, a contribué à l’article, tout comme Fatma Najar (Ph. D. 2022), professeure adjointe au John Jay College of Criminal Justice, ainsi que Nuha Zamzami (Ph. D. 2020) et Hanen Himdi, professeures adjointes à l’Université de Djedda, en Arabie saoudite.
Lisez l’article cité : « SmoothDetector: A Smoothed Dirichlet Multimodal Approach for Combating Fake News on Social Media ».