Athena - une expérience où l’on fait voter 5 000 faux Coréens à une IA (gouverneurs et maires métropolitains des élections locales de 2026)
(github.com/Kimchikilla)J’ai connecté un LLM à Nemotron-Personas-Korea et lancé une simulation des élections locales de 2026 pour les gouverneurs et maires métropolitains.
Crawl de 8 300 candidats depuis la NEC → échantillonnage de 5 100 personas à raison de 300 par province/ville → simulation de 4 800 votes avec Gemma 4 e4b (RTX 5060, 3 heures).
Résultats
Maire de Daegu : Kim Han-gu (indépendant) 90,5 % / Lee Jae-man (PPP) 8,2 % / Kim Boo-kyum (Parti démocrate) 1,4 %
Ancien Premier ministre + 4 mandats + originaire de Daegu, et pourtant 1,4 %. Le LLM s’est laissé attirer par le label « travailleur » dans la persona et a massivement reporté les voix vers le candidat indépendant ouvrier.
Schéma global :
- surévaluation de la prime au sortant (Kim Jin-tae au Gangwon 100 %, Lee Cheol-woo au Gyeongbuk 99 %)
- appariement simpliste des libellés de profession
- explosion des abstentions quand l’information est insuffisante (Chungbuk 73 %, Incheon 93 %)
Conclusion
Une simulation de personas par LLM ne peut pas remplacer un sondage d’opinion. Cela confirme de manière quantitative que les recherches américaines sur les LLM-as-voter ne s’appliquent pas telles quelles à la politique coréenne.
4 commentaires
Je suis le créateur de "ManyPerson" mentionné dans "Articles recommandés".
Comme vous l’avez dit, la simulation de personas par LLM n’est pas un substitut aux sondages d’opinion, mais un « complément ».
Bien sûr, plus on ajoute de précision aux personas et d’informations de contexte, plus on peut se rapprocher du résultat réel, mais fondamentalement, moi aussi j’ai conçu ce service non comme un substitut, mais comme un complément.
Malgré cela, je pense qu’il a largement sa valeur.
Je suis d'accord !!
En y repensant maintenant, tout à l’heure j’étais un peu débordé, donc j’ai laissé ma réponse en plan pendant que je l’écrivais ;;
Pour commencer, à mes yeux, l’une des valeurs des réponses de personas IA est avant tout de fournir aux utilisateurs ou aux rédacteurs un champ de vision plus large.
C’est aussi ce que j’ai ressenti en créant ce service : ma manière de voir le monde ou les événements s’est effectivement élargie.
On passe de « Pourquoi il pense ça comme ça ? » à « Ah, donc on peut aussi recevoir et comprendre ce type d’événement de cette manière-là… »
Ça permet de regarder les choses avec plus d’ouverture.
Je pense que c’est pareil dans le cas des élections que vous mentionnez.
Je viens justement de lancer un test sur Daegu, et le résultat était assez éloigné de la réalité.
manyperson Link
Nous avons aussi fait des tests similaires sur notre service, et les résultats ne tombent pas exactement… comme je l’imaginais, mais ils permettent quand même de voir des points de vue variés. ( Bien sûr, ce n’est pas très précis en raison de la mise à jour des informations récentes, mais je pense que c’est quelque chose qu’on pourra couvrir progressivement sur le plan technique. )
En fait, pour notre service lui-même aussi, pendant les tests, on l’a fait tourner en se demandant ce que les gens en penseraient… et c’était très positif, mais en réalité, je ne sais pas encore trop pour l’instant ^^;;
Les LLM raisonnent au niveau des tokens textuels, donc lorsqu’un label à haute fréquence apparaît, il semble que les schémas associés à ce label pendant l’entraînement s’activent et tendent à écraser les autres informations.
De plus, même si une persona comporte des labels détaillés, le comportement de vote de cette personne n’est pas déterminé comme une fonction que le LLM peut inférer ; ce qui détermine réellement le comportement politique, c’est l’historique des votes précédents, le parti soutenu par la famille et les collègues, les actualités vues récemment, le degré de sympathie personnelle pour le candidat, et bien d’autres informations absentes d’une persona synthétique.
Cela semble d’ailleurs s’appliquer simultanément à l’inférence de toutes sortes de situations ou phénomènes économiques et politiques.