article

Comment les cartes linguistiques de l’IA peuvent protéger de la désinformation avant la présidentielle américaine

4 novembre 2024

Par Rana Ali Adeeb

Cet article a été publié dans Le Devoir

Vous êtes-vous déjà demandé pourquoi des outils d’intelligence artificielle (IA), comme ChatGPT, fournissaient parfois des réponses différentes à des questions presque identiques ? La réponse réside dans leur façon d’interpréter le langage, non pas par les mots eux-mêmes, mais par une transformation mathématique appelée vectorisation. Ce processus permet à l’IA de transformer des contenus — comme des titres, des articles d’actualité ou des publications sur les réseaux sociaux — en « vecteurs » numériques qui représentent leur sens, leur ton et leur contexte au sein d’une vaste « carte » linguistique invisible. Les mots aux significations ou aux sentiments similaires tendent à se regrouper dans cet espace, ce qui crée un réseau de connexions qui révèle des nuances plus profondes que de simples recherches par mots-clés.

On peut se demander pourquoi cela est important dans le contexte de la désinformation, l’un des plus grands défis en ligne aujourd’hui. Tout comme ChatGPT peut donner des réponses différentes selon le ton ou la formulation des demandes, la vectorisation permet à l’IA de détecter quand un contenu est conçu pour manipuler plutôt que pour informer. En effet, la vectorisation, autrefois principalement utilisée dans le domaine technologique pour améliorer les réponses de l’IA, joue maintenant un rôle essentiel dans le repérage de contenus qui pourraient déformer la réalité ou être conçus pour manipuler les émotions.

Avec l’élection présidentielle américaine de 2024 à l’horizon, la nécessité de détecter les déclencheurs émotionnels, les nuances contextuelles et les contenus visant à influencer l’opinion publique est plus urgente que jamais.

L’alliance entre la vectorisation et la détection des fausses informations semble prometteuse. Tout d’abord, la désinformation est rarement une simple déclaration répétée à l’identique ; elle se transforme, adoptant de nouvelles formulations tout en conservant le même message de fond. Les outils d’IA, entraînés grâce à la vectorisation, offrent une défense renforcée contre la désinformation, car ils peuvent détecter les variations dans les énoncés et analyser l’« empreinte sémantique » des contenus pour signaler lorsque des messages reformulés rappellent des récits trompeurs connus.

Deuxièmement, des études montrent que les fausses informations utilisent souvent un langage chargé conçu pour provoquer la colère, la peur ou l’urgence. Une étude de 2022 a démontré qu’en décomposant les contenus en vecteurs, les systèmes d’IA peuvent détecter quand le langage est disproportionnellement émotionnel ou alarmiste, des traits souvent présents dans les titres manipulateurs. Par exemple, un système d’IA peut reconnaître que des mots comme « urgent » ou « alarmant » associés à certaines phrases indiquent une manipulation émotionnelle et les signaler en conséquence.

Troisièmement, il est important de se rappeler que tout contenu trompeur n’est pas ouvertement faux ; certains sont cadrés ou accentués de manière sélective pour créer des perceptions faussées. Par exemple, un titre peut être techniquement vrai, mais formulé de façon à orienter le lecteur vers un certain point de vue. La vectorisation permet à l’IA de détecter ces techniques de cadrage subtiles en créant une représentation unique du contenu basée sur le ton et les accents. Un tel cadrage peut être aussi puissant que la désinformation pure et simple, et la vectorisation donne à l’IA les outils nécessaires pour repérer ces tactiques, en alertant les utilisateurs lorsque le contenu est présenté de manière à renforcer les biais.

Enfin, les représentations vectorisées permettent à l’IA de regrouper les sources de désinformation selon leurs similitudes thématiques. Imaginez plusieurs articles promouvant le même récit trompeur, chacun formulé légèrement différemment. La vectorisation permet à l’IA d’identifier ces groupes de contenus connexes, même s’ils apparaissent dans différentes sources. En regroupant ces articles interconnectés, l’IA peut révéler des réseaux de désinformation qui pourraient autrement passer inaperçus.

Ce type de regroupement s’est avéré efficace, comme le souligne une étude qui a montré que les approches vectorisées de détection de la désinformation peuvent repérer des réseaux d’articles trompeurs, mais indépendamment rédigés. En les recoupant avec des sources fiables, l’IA peut alors fournir une évaluation plus précise de la crédibilité de l’histoire.

Au moment où les électeurs se préparent à voter, l’IA vectorisée pourrait se révéler précieuse pour la protection de la démocratie en permettant de s’assurer que le public accède à des informations crédibles et équilibrées. Avec la désinformation qui se propage comme une traînée de poudre, il est rassurant de savoir que les avancées en IA, et notamment la vectorisation, prennent le relais pour combattre ce problème. À l’ère numérique, la vectorisation pourrait bien être le chevalier en armure de la démocratie, qui permettrait à l’IA de défendre la vérité face à une multitude de récits manipulés.

Actualités

Actualités

article

Comment les cartes linguistiques de l’IA peuvent protéger de la désinformation avant la présidentielle américaine