La Russie empoisonne Wikipedia
(bettedangerous.com)- Selon l’Atlantic Council, la Russie a étendu, développé et adapté sur mesure ses opérations d’influence pour diffuser des contenus pro-Kremlin dans les articles de Wikipedia et les outils d’IA populaires, tout en blanchissant des contenus issus de médias sanctionnés afin d’aligner les sources d’information mondiales sur les récits du Kremlin
- Le réseau Pravda est un ensemble de portails d’actualité frauduleux visant plus de 80 pays et territoires dans le monde, fonctionnant comme une usine de blanchiment informationnel qui sature le flux d’actualités en amplifiant les formulations des médias russes et des canaux Telegram pro-Kremlin
- Après avoir analysé 193 sites entre septembre et décembre 2023, VIGINUM a conclu que ce réseau ne produisait pas de contenu original, mais relayait massivement des réseaux sociaux russes et pro-russes, des agences de presse russes et des sites officiels locaux, ce qui relève d’une ingérence numérique étrangère
- L’Institute for Strategic Dialogue a appliqué une approche de regroupement sémantique à 48 pages liées à l’Ukraine, associées à l’article Russo-Ukrainian war sur Wikipedia en anglais, afin de détecter à grande échelle des manipulations discrètes et coordonnées de la plateforme
- Comme le contenu de Wikipedia est souvent utilisé pour l’entraînement des LLM, l’insertion de portails pro-russes comme sources faisant autorité peut exposer les utilisateurs de chatbots d’IA à des messages pro-Kremlin, anti-ukrainiens et anti-occidentaux
Manipulation informationnelle pro-russe visant Wikipedia et les outils d’IA
- Selon Exposing Pravda: How pro-Kremlin forces are poisoning AI models and rewriting Wikipedia de l’Atlantic Council, cette opération a intensifié son activité dans des contextes comme les élections en Roumanie et en Moldavie, ou les débats politiques entre Donald Trump et Volodymyr Zelenskyy
- L’Atlantic Council considère le réseau Pravda comme un ensemble de portails d’actualité frauduleux visant plus de 80 pays et territoires dans le monde, et estime que la Russie l’a lancé en 2014
- Dans un rapport publié en 2024, l’organisme français de veille contre la désinformation VIGINUM a confirmé les activités malveillantes d’une société informatique basée en Crimée, tandis que le Digital Forensic Research Lab (DFRLab) de l’Atlantic Council a affirmé avoir établi l’implication directe de la Russie dans ce réseau
Détection des manipulations sur Wikipedia et articles sur la guerre russo-ukrainienne
- Identifying Sock Puppets on Wikipedia de l’Institute for Strategic Dialogue prend pour objet d’analyse l’article Russo-Ukrainian war de Wikipedia en anglais ainsi que 48 pages liées à l’Ukraine qui y sont directement rattachées, à l’aide d’une approche de « regroupement sémantique » (semantic clustering)
- De nombreux environnements informationnels — Twitter, Facebook, YouTube, Instagram, TikTok, sites web indépendants — ont été ciblés par des activités malveillantes, mais Wikipedia reste un espace bien moins étudié que les grands réseaux sociaux
- L’objectif de la recherche est de créer, tester et évaluer une méthode permettant de détecter à grande échelle les manipulations discrètes et coordonnées de la plateforme sur Wikipedia
- La structure collaborative de Wikipedia présente l’avantage d’influencer le savoir public, mais elle peut aussi servir de surface d’attaque à des manipulations organisées modifiant le contenu des articles et leurs sources citées
- La « manipulation coordonnée » autour des articles Wikipedia relatifs à l’invasion de l’Ukraine par la Russie a déjà été abordée dans plusieurs rapports
Portal Kombat et l’ingérence numérique étrangère
- L’organisme français VIGINUM a analysé, entre septembre et décembre 2023, des « portails d’information » diffusant des contenus pro-russes et visant plusieurs pays occidentaux, dont la France
- PORTAL KOMBAT: A structured and coordinated pro-Russian propaganda network de VIGINUM étudie un réseau de 193 sites qui couvraient initialement l’actualité de la « région Russie-Ukraine »
- L’orientation éditoriale de ce réseau a changé dès le lendemain de l’invasion de l’Ukraine par la Russie, pour commencer à viser les territoires ukrainiens occupés ainsi que les pays occidentaux soutenant l’Ukraine et sa population
- Ces sites ne produisent pas de contenu original et relaient massivement principalement trois types de sources
- des contenus issus de comptes de réseaux sociaux d’acteurs russes ou pro-russes
- des contenus d’agences de presse russes
- des contenus provenant des sites officiels d’institutions ou d’acteurs locaux
- VIGINUM estime que l’objectif principal de ce réseau est de traiter le conflit russo-ukrainien de façon à présenter positivement « l’opération militaire spéciale » et à dénigrer l’Ukraine ainsi que ses dirigeants
- VIGINUM juge que ces contenus sont fortement marqués idéologiquement et présentent de manière répétée des récits inexacts ou trompeurs
- Le site pravda-fr[.]com, visant la France, est analysé comme contribuant directement à polariser l’espace public numérique francophone
- VIGINUM a repéré des indices montrant que pravda-fr[.]com avait été inséré comme source dans un article Wikipedia lié à la « situation géopolitique » en mer Rouge
- L’article de Wikipedia en français « Opération Gardien de la prospérité », créé le 22 décembre 2023, a été modifié le lendemain par l’utilisateur « @ Lataupefr »
- Cette modification a inséré deux articles de pravda-fr[.]com, dont les sources étaient les canaux Telegram pro-russes « @ BrainlessChanel » et « @ kompromatmedia »
- Historique de la modification : https://fr.wikipedia.org/w/index.php/…
- VIGINUM considère que la sélection précise de sources pro-russes montre un véritable effort de ciblage pour diffuser des récits stratégiques
- VIGINUM conclut que ce réseau relève de l’ingérence numérique étrangère (foreign digital interference), au regard de ses caractéristiques techniques, de ses procédures d’exécution et de ses objectifs poursuivis
Storm-1516 et l’extension de la guerre informationnelle
- Selon un article de Meduza, JD Vance et Marjorie Taylor Greene ont promu une fausse histoire issue du réseau russe de désinformation Storm-1516
- Storm-1516 serait lié au GRU et aurait recruté d’anciens membres de l’Internet Research Agency, basée à Saint-Pétersbourg, connue pour avoir attaqué la perception des Américains afin d’aider à l’élection de Donald Trump en 2016
- L’histoire relayée par Vance et Greene prétendait à tort qu’une aide militaire destinée à l’Ukraine avait servi à acheter un yacht
- Dix ans après l’élection présidentielle américaine de 2016, cette évolution s’inscrit dans une extension de la guerre informationnelle, à mesure que de nouveaux outils sont militarisés
Modèles d’IA et blanchiment de contenu
- L’Atlantic Council estime que la Russie empoisonne les outils d’IA et Wikipedia dans le cadre d’une tentative de contourner les sanctions mondiales visant les médias russes
- Les portails pro-russes fonctionnent en apparaissant sur Wikipedia comme des sources faisant autorité, et comme des médias crédibles cités par les grands modèles de langage (LLM)
- Dans ce processus, les récits russes sur la guerre en Ukraine sont réécrits, et si les LLM sont entraînés sur des sources comme Wikipedia, les utilisateurs de chatbots d’IA peuvent être exposés à des messages pro-Kremlin, anti-ukrainiens et anti-occidentaux
- L’Atlantic Council estime qu’à mesure que les chatbots d’IA progressent, les contenus manipulés par le Kremlin peuvent être adaptés pour influencer l’Internet mondial et fausser la compréhension des faits ainsi que la capacité de décision
- Cette opération soulève la question de la transparence de l’entraînement des modèles d’IA, ainsi que du défi de la modération de contenus issus de sources manipulées par la Russie, qui ont contribué à diviser le soutien occidental à l’Ukraine
- L’Atlantic Council la qualifie d’opération d’influence russe en ligne enracinée dans l’Internet mondial
Fork russe de Wikipedia et manipulation du savoir
- Characterizing Knowledge Manipulation in a Russian Wikipedia Fork s’appuie sur un jeu de données de 1,9 million d’articles de Wikipedia en russe et de leur fork, analysé comme un « effort organisé visant à manipuler le savoir »
- Wikipedia est la plus grande encyclopédie du monde et le neuvième site web le plus visité au monde, occupant une position influente dans l’écosystème du web
- Wikipedia est présenté comme un projet visant à devenir « la somme de toutes les connaissances humaines » grâce aux efforts d’une communauté collaborative
- Cette recherche considère que les connaissances diffusées par Wikipedia ont un impact sociétal important, et aborde des cas où des États autoritaires comme la Chine et la Turquie ont purement bloqué la plateforme
- La section « Relevance » de l’étude estime que les informations que les citoyens trouvent en ligne sur l’histoire de leur pays peuvent influencer l’identité nationale et l’opinion publique
- Wikipedia a été classé comme la sixième source d’information la plus importante sur les sujets historiques, devant les visites de musées, les cours universitaires et les réseaux sociaux
- Ainsi, la manipulation des contenus de Wikipedia peut avoir un impact social important, même si elle se produit sur d’autres plateformes
- Le contenu de Wikipedia étant souvent utilisé pour l’entraînement des LLM, si une version manipulée de Wikipedia est utilisée comme donnée d’entraînement, cela peut produire des systèmes d’IA favorisant certains biais
Grokipedia et les pressions autour de Wikipedia
- La Grokipedia d’Elon Musk a été décrite peu après son lancement dans un article du Guardian comme poussant des idéologies extrémistes et de la propagande russe
- Musk avait l’année précédente appelé au boycott de Wikipedia, qu’il avait qualifié de « Wokepedia »
- L’administration Trump aurait menacé de retirer son statut d’exonération fiscale à l’organisation à but non lucratif Wikipedia, à l’occasion de son 25e anniversaire
- L’entrecroisement entre Wikipedia, les données d’entraînement de l’IA, les encyclopédies alternatives et les pressions politiques met en lumière à la fois la fiabilité des plateformes de connaissance et leur vulnérabilité à la manipulation
1 commentaires
Commentaires Hacker News
Le lien que l’article voulait probablement pointer semble être https://arxiv.org/abs/2504.10663
En parcourant le papier, les auteurs cherchent à distinguer les différences entre les articles de la Wikipedia russe et ceux du fork russe
Les articles du fork qui diffèrent de la Wikipedia russe avaient été beaucoup plus souvent modifiés sur la Wikipedia russe, et les auteurs y voient un possible signe de manipulation, tout en indiquant dans la discussion qu’il n’est pas forcément évident que la qualité se soit dégradée
Il est tout à fait plausible qu’il y ait des activités soutenues par des États sur Wikipedia, mais je ne suis pas encore convaincu qu’il s’agisse d’une preuve claire que la Russie a réussi à polluer Wikipedia
Après avoir digéré le choc, il a enquêté sur les relations entre la Russie et Wikipedia, et en a conclu que l’État russe exploite depuis longtemps la structure de crowdsourcing de Wikipedia pour déformer le savoir public de manière continue
Par exemple, si l’on regarde l’article “Child abductions in the Russo-Ukrainian war”, la première phrase répète le chiffre de 20 000 enfants comme un élément de propagande ukrainienne, alors que le fait que l’Ukraine n’ait fourni qu’une liste de 339 noms est relégué dans la section “Russian reaction”
J’imagine que seuls 5 % des lecteurs vont au-delà du résumé, et que la plupart d’entre eux sauteront simplement une section intitulée comme un article de “propagande russe”. Essayer d’ajouter ce fait dans le résumé me paraît difficile
https://en.wikipedia.org/wiki/Child_abductions_in_the_Russo-...
https://en.wikipedia.org/wiki/Child_abductions_in_the_Russo-...
Le problème particulier de la Russie, c’est qu’elle dépense énormément d’argent pour ce genre de choses. Selon l’amiral Giuseppe Cavo Dragone, la Russie dépense environ 2 milliards de dollars par an en guerre cognitive
Il existe une longue liste de controverses : https://en.wikipedia.org/wiki/List_of_Wikipedia_controversie...
Si l’on regarde les premières versions de nombreux articles historiques et informatifs sur différents pays dans Wikipedia, ils indiquent eux-mêmes provenir de documents historiques du département d’État américain ou de la CIA sur ces pays
Quand je modifiais l’article sur le massacre de civils commis par l’armée américaine à No Gun Ri, en Corée, une certaine IP de CENTCOM annulait mes modifications
J’essayais d’ajouter des faits pendant mes pauses, tandis que les impôts que je payais pendant mes heures de travail servaient à financer une organisation de propagande militaire américaine qui les supprimait
Pendant que les États-Unis enlèvent le président du Venezuela et son épouse, imposent un blocus à Cuba et bombardent l’Iran, quelqu’un passe aussi son temps à salir la Russie pour que mes impôts servent davantage à financer des guerres sans fin autour de ses frontières, formidable
Surtout quand Wikipedia est utilisée assez largement pour l’entraînement des grands modèles de langage, on ne devrait pas minimiser l’impact de ce type de modifications
Il y a 25 ans, il existait peu de ressources publiques en ligne librement réutilisables, et pour des faits de base non controversés, ce recueil pouvait très bien faire office de référence en ligne à jour jusqu’à l’arrivée d’autres sources
Mais c’est tout de même très différent du fait qu’un employé de CENTCOM modifie la description historique des brutalités du gouvernement américain
Heureusement, notre gouvernement ne s’abaisserait jamais à ce niveau
https://web.archive.org/web/20240630174704/https://ru.wikipe...
On a fait comme s’il ne fallait surtout pas savoir que McCain, Nuland et d’autres étaient impliqués dans le changement de régime à Kyiv en 2013, alors qu’il y a même des photos
Il suffit d’imaginer le tollé qu’il y aurait eu si, en 2021, des responsables du ministère russe des Affaires étrangères avaient distribué de la nourriture aux personnes qui attaquaient le Capitole
https://web.archive.org/web/20240630174704/https://ru.wikipe...
Je pense qu’il est courant que les gouvernements modifient Wikipedia dans le cadre de leur stratégie de communication
Je consulte souvent les Wikipedias en anglais, polonais et russe, et on y voit beaucoup de traces d’interventions étatiques
Par exemple, sur les sujets liés à la Pologne, les articles en russe ont généralement une tonalité négative et contiennent de très étranges citations, comme si des personnages des années 1920 avaient été interviewés dans un bar. La plupart relèvent d’anecdotes privées, ou sont proches de pures inventions de leurs auteurs
Au-delà des sujets polonais, les éditeurs russes dominent la Wikipedia russe et exercent aussi une forte influence sur les articles importants d’autres pays russophones comme la Biélorussie, l’Ukraine et les États post-soviétiques de l’Est
De plus, les articles en anglais sur la République des Deux Nations sont activement retravaillés par des éditeurs lituaniens. Bien que la noblesse polonaise ne parlait pas du tout lituanien et portait des noms manifestement slaves, ces noms sont remplacés par des formes lituaniennes dès lors que ces personnes occupaient une fonction sur le territoire de la Lituanie actuelle ou ont participé à un événement que les historiens lituaniens considèrent comme “positif”
C’est agaçant, mais si un pays peut faire cela, c’est une grande victoire. Pouvoir façonner l’opinion publique via des sources “neutres” est un énorme succès de communication
La communication d’État est très importante. Il suffit de regarder l’image “positive” de la Switzerland ou du Japan, l’échec catastrophique de la communication d’Israel ces dernières années, ou ce que font aujourd’hui les monarchies pétrolières arabes
C’est une stratégie assez intéressante, et le terme “pollution” semble encore mieux s’appliquer au domaine de l’intelligence artificielle, qui apprend en s’appuyant sur Wikipedia
Heureusement, il leur est difficile de supprimer réellement les informations bien établies sur le fonctionnement de leur propre système gouvernemental. Ces informations deviennent même de plus en plus faciles à comprendre, avec une aide officielle en prime
Le désespoir intérieur ne fera que croître, et il n’existe aucune voie de changement démocratique alors même que la compréhension réelle de la gouvernance des sujets fédéraux s’éloigne toujours davantage de la connaissance des explications officielles
Bien sûr, le district fédéral central, ou même le Pecherskyi raion, ne semble pas s’en rendre compte
La Russie, comme toujours, est un fardeau pour l’humanité
Ce qui rend Wikipedia utile, ce sont les sources citées. Comme on n’enseigne pas la philosophie à l’école, les gens n’ont pas de véritable conception de ce que signifie la vérité