1 points par GN⁺ 2026-01-19 | 1 commentaires | Partager sur WhatsApp
  • Une analyse du phénomène par lequel les contenus générés par l’IA en viennent à représenter une part importante des interactions sur Internet
  • À partir d’une polémique sur HackerNews autour du caractère généré ou non par l’IA d’un projet open source, l’auteur observe des schémas laissant penser que même les commentaires semblent écrits par une IA
  • À l’époque d’IRC et des forums phpBB, les échanges entre vrais humains étaient au centre, alors qu’aujourd’hui des images, commentaires et bouts de code produits par l’IA se mêlent au quotidien
  • Il a aussi constaté sur LinkedIn et ailleurs des cas où des photos d’entreprise manipulées par l’IA sont publiées comme de véritables posts d’employés
  • Il exprime son inquiétude face à une évolution technologique qui semble s’orienter non plus vers le partage du savoir humain, mais vers des conversations entre bots et le reconditionnement commercial de contenus

Polémique sur HackerNews et prise de conscience du problème

  • L’auteur découvre sur HackerNews un projet open source publié par un utilisateur
    • Dans les commentaires, plusieurs utilisateurs anonymes soupçonnent que le code a peut-être été généré par l’IA
    • Des remarques pointent la chronologie des commits, le style des commentaires dans le code et d’autres indices évoquant une production par IA
  • L’auteur n’est pas opposé à l’usage de l’IA en soi, mais souligne qu’il faut indiquer explicitement son utilisation dans l’open source
    • Parce que la plupart des participants sur Internet sont anonymes, il est difficile de vérifier leur expertise ou l’authenticité de ce qu’ils publient
    • Les LLM peuvent être utiles pour des tâches simples, mais ils peuvent devenir dangereux sur des problèmes complexes ou des edge cases

Les traces de l’IA visibles dans les commentaires

  • L’auteur remarque aussi dans les commentaires du créateur du projet un style typique de l’IA
    • Exemple : usage excessif du tiret cadratin (—), expressions peu naturelles comme "you are absolutely right"
    • Répétition de structures de phrase typiques de l’IA comme "let me know if you want to [do that thing] or [explore this other thing]"
  • Comme ces formulations diffèrent des habitudes langagières réelles, cela amène à douter que l’interlocuteur soit une vraie personne

La prise de conscience de la « théorie de l’Internet mort »

  • Cette expérience rappelle à l’auteur la Dead Internet Theory
    • Cette théorie soutient que, depuis environ 2016, la majeure partie d’Internet serait remplie d’interactions entre bots et de contenus générés par des machines
    • Le but de ces contenus serait principalement lié à la vente de produits ou à la manipulation du SEO

Contraste entre l’Internet d’hier et celui d’aujourd’hui

  • Au début des années 2000, à l’époque d’IRC et des forums phpBB, l’apprentissage et les échanges entre humains réels étaient centraux
    • L’auteur qualifie cette période d’« Internet University » et se souvient y avoir appris les réseaux, les systèmes d’exploitation, les jeux et le développement web
    • À l’époque, il était évident que l’on parlait à de vraies personnes
  • Aujourd’hui, la réalité est celle d’un mélange d’images IA et de commentaires IA, où il devient difficile de distinguer le vrai du faux

Inquiétudes face à la prolifération des contenus IA

  • Sur LinkedIn, il a vu des photos de bureau manipulées par l’IA publiées par de vrais employés d’entreprise
    • Des formes de mains étranges et du texte sans signification trahissaient leur génération par IA
    • Il soulève même la possibilité que les personnes présentes sur ces photos n’existent pas
  • Sur Facebook, Xitter, TikTok et d’autres plateformes également, les faux contenus générés par l’IA se propagent
    • Exemples : une image montrant un personnage géant construisant une pyramide, ou des vidéos véhiculant un message politique précis
  • L’auteur explique que cette réalité lui inspire tristesse et impuissance
    • Avec l’accessibilité grand public de l’IA, les « AI-slop » (déchets de contenu IA) débordent
    • Nous sommes entrés dans une époque où les gens n’écrivent plus directement leurs textes ou leur code, mais les confient à des agents IA

Doutes sur l’avenir de la technologie et du savoir humain

  • L’auteur affirme aimer toujours la technologie et l’ingénierie logicielle, mais
    estime que l’Internet d’aujourd’hui devient un espace où des bots parlent à d’autres bots
  • Le savoir humain est reconditionné en contenus commerciaux du type « 10 étapes pour résoudre votre problème du quotidien »,
    et le sens originel du partage des connaissances est en train de disparaître

1 commentaires

 
GN⁺ 2026-01-19
Avis sur Hacker News
  • Il y a peu, mes parents se sont fait avoir par une fausse vidéo YouTube générée par IA. C’était une vidéo montrant un « policier raciste » en train d’agir de façon odieuse, et au début moi aussi j’ai hésité parce que ça avait l’air réel. En cherchant, je n’ai trouvé aucune source, seulement des reuploads. La description de la chaîne disait que « certaines vidéos sont des reconstitutions par IA d’événements réels », mais ça n’inspirait aucune confiance. C’est vraiment triste que ce genre de contenu attise les divisions pour les revenus publicitaires de YouTube

    • Pour les contenus racialisés, la demande dépasse l’offre. La réalité seule ne suffit pas à entretenir l’indignation, donc ce type de vidéos continue d’être produit
    • Les vidéos IA se repèrent souvent rien qu’en regardant l’historique de publication du compte. Ça poste trop souvent, de façon répétitive, avec des thèmes et des décors incohérents. Même si la technologie progresse, ce genre de schéma ne disparaîtra probablement pas
    • En ce moment, je passe beaucoup trop de temps sur le subreddit RealOrAI. À chaque fois que je me trompe, ça m’angoisse et j’en regarde encore plus pour mieux faire la différence. Mais il faudra peut-être accepter qu’on vit désormais dans une réalité où l’on ne peut plus distinguer le vrai du faux
    • En réalité, cette inquiétude n’a rien de nouveau. Même avant, il était courant de provoquer des divisions avec des photos manipulées ou des vidéos sorties de leur contexte. L’IA n’a fait que rendre ça plus facile
    • J’aimerais que Google signale automatiquement les vidéos contenant du contenu IA
  • Je suis totalement d’accord avec l’idée que « ce n’est pas un réseau social ». Avant, les « réseaux sociaux » désignaient un espace d’échange avec ses amis du monde réel, mais aujourd’hui le terme englobe même des forums comme Reddit. Résultat : les espaces de véritable interaction sociale ont presque disparu

    • Aujourd’hui, ce rôle est surtout joué par Discord. Comme ce sont des communautés sur invitation, il n’y a pas de feed public, et la modération est assurée directement par de vraies personnes. Même mes amis de l’époque IRC ont tous migré vers Discord. Le jour où l’entreprise sera cotée en bourse, j’imagine qu’on passera à un équivalent comme Matrix
    • À l’origine, « social media » désignait un réseau où l’on partageait directement du contenu avec ses amis. Mais quand Facebook a basculé vers un modèle centré sur le reshare, c’est devenu une plateforme de consommation de contenu aléatoire plutôt qu’un lieu pour suivre les nouvelles de ses amis. HN, sans fonction d’amis, ressemble donc davantage à un forum
    • On appelle aussi TikTok ou Instagram des plateformes « sociales », mais la plupart des gens n’y publient rien du tout. Ce ne sont que des plateformes de consommation média
    • En fait, je n’ai jamais utilisé Discord, donc je ne sais pas trop. Ça me donne juste l’impression d’être une version d’IRC gérée par une entreprise, et je ne comprends pas pourquoi c’est si populaire
    • Meta a indiqué que moins de 10 % des utilisateurs interagissent avec des personnes qu’ils connaissent réellement. Les réseaux sociaux actuels ne sont plus qu’un « divertissement à faire défiler »
  • Dire que personne n’utilise l’« em dash (—) » est une idée fausse. J’en ai toujours beaucoup utilisé. Des expressions comme « you’re absolutely right » servent aussi souvent de blague sarcastique entre amis. Entre nous qui avons grandi au Royaume-Uni, c’est tout à fait naturel

    • En ce moment, c’est agaçant de voir qu’il suffit d’avoir une bonne typographie pour qu’on vous accuse d’avoir écrit avec un LLM. J’utilise les en dash et em dash depuis longtemps. Avec la Compose key, c’est facile à saisir
    • Le problème n’est pas l’em dash en soi. L’anglais n’est pas ma langue maternelle, donc j’ai pratiqué en tenant un blog, et j’ai testé plusieurs façons de l’utiliser parce que la présence ou l’absence d’espaces change l’impression produite. Au final, la plupart des gens sont incohérents. Quelqu’un qui écrit avec une grammaire trop parfaite a au contraire plus de chances d’être une IA
    • C’est peut-être à cause de la politesse britannique, mais j’utilise naturellement des formulations comme « you’re right, but… »
    • Dans la newsletter de notre librairie aussi, on utilise l’em dash. C’est visuellement plus propre qu’un point-virgule et utile pour séparer les phrases
    • Sur iOS, il suffit de maintenir la touche « - » enfoncée pour le saisir facilement, donc je l’utilise souvent
  • Il existe un moyen simple de vérifier si une image a été générée par IA.

    • OpenAI utilise les métadonnées C2PA,
    • Gemini utilise le filigrane SynthID.
    • SynthID s’applique non seulement aux images mais aussi au texte, et le code est également public
    • Mais avec un modèle image-to-image, on peut effacer SynthID en ajoutant ou en supprimant du bruit
    • J’ai même essayé de téléverser les images du blog d’OpenAI sur le site de vérification, et elles n’avaient pas de métadonnées. Ce genre de chose fait baisser la confiance
    • Cela dit, le but de C2PA est de prouver qu’un contenu est authentique. On ne peut pas tout vérifier, mais une image certifiée peut aussi servir de preuve juridique
  • Le problème actuel vient au fond de la structure d’incitation des plateformes.

    • Sur YouTube, c’est la vue ; sur LinkedIn, l’auto-promo ; sur HN, la promotion de startup.
    • Peut-on créer une communauté où l’IA est inutile, fondée uniquement sur des interactions humaines sincères ?
    • Au fond, la seule réponse est peut-être un petit groupe d’amis
    • Avant, on pouvait discuter avec des gens brillants sur des forums phpBB gratuits ou sur IRC. Mais je réalise seulement maintenant à quel point les coûts d’exploitation et la charge de modération étaient élevés
    • Ce type de communauté devrait être limité par le nombre de Dunbar (Dunbar’s number). Au-delà, elle ne peut pas tenir sans règles ni administrateurs
    • Aujourd’hui, même les vidéos inexactes finissent quand même par générer des vues et des revenus publicitaires. La plateforme, elle, n’assume rien
    • Peut-être que ça marcherait avec une structure sans publicité, montrant uniquement un feed centré sur les amis et sans feed global, mais l’UX en souffrirait
    • Au final, la racine du problème, c’est le modèle d’Internet financé par la publicité. Même pour Twitter, c’est une limite structurelle plus profonde qu’Elon Musk
  • Je ne pense pas qu’il faille obliger à déclarer l’usage de l’IA quand on publie du code open source. Ce genre d’exigence ne ferait que décourager la création. Les gens veulent partager le code qu’ils ont écrit, pas prouver qu’ils n’ont pas utilisé l’IA

    • Mais dans certains cas, l’auteur continue d’affirmer qu’il « n’a pas utilisé l’IA » alors qu’il reste dans le code des traces manifestes de génération par IA, et ça donne presque l’impression d’être victime de gaslighting
  • Je me demande s’il existe des plateformes de réseaux sociaux qui interdisent l’IA. Peut-être qu’on pourrait l’empêcher via les métadonnées d’image ou l’analyse du comportement utilisateur

    • Si une telle plateforme voit le jour, ce sera le paradis de l’adversarial training
    • Bluesky ne l’interdit pas officiellement, mais la communauté y est très hostile à l’IA, donc il y en a presque pas
    • Il paraît que le nouveau Vine, en cours de relance, va interdire explicitement le contenu IA
    • Des endroits comme Mastodon.art interdisent clairement l’IA
    • Au final, il peut exister des communautés qui bloquent l’IA par la seule pression sociale
  • J’espère que le jour où tout le contenu en ligne sera produit par IA, les humains rechercheront à nouveau le réel

    • On voit déjà un peu ce changement. Avant, c’était « pas de photo, pas de preuve », mais maintenant que même les photos peuvent être manipulées, je ne prends plus de photos que comme vrais souvenirs
    • Mais il est aussi très probable que beaucoup de gens se satisfassent au contraire d’interactions avec l’IA
    • Déjà aujourd’hui, on n’arrive pas à lâcher nos téléphones ; si l’IA se met à fabriquer du contenu optimisé, on y sera encore plus accros
    • Malgré tout, c’est une pensée assez réconfortante
  • Nous sommes désormais dans une époque au-delà du test de Turing. Si l’on n’arrive plus à distinguer l’humain de l’IA, ce n’est peut-être pas parce que l’IA est devenue plus intelligente, mais parce que nos conversations en ligne sont devenues superficielles

    • Mais le vrai test de Turing ne consiste pas seulement à se laisser tromper : il faut qu’un interrogateur conversationnel (interrogator) ne puisse pas faire la différence. Les LLM actuels n’en sont pas encore là
    • Le texte contient peu d’information, et il y a cette confiance implicite dans le fait qu’un humain l’a écrit, ce qui facilite la tromperie. C’est pour cela que l’IA textuelle est particulièrement dangereuse. Il m’arrive même aujourd’hui, au téléphone, de me demander si mon interlocuteur est une personne ou un robot
    • Au final, il faut une vision équilibrée du type « d’un côté… » « de l’autre… »
  • Moi, j’appelle ça l’“effet tapis”. Quand une vidéo ou une structure de conversation est parfaitement alignée, cela dégage quelque chose d’artificiel. Comme avec les tapis marocains, il faut volontairement laisser une part d’imperfection pour paraître humain. Mais j’ai l’impression que même ces signes-là vont bientôt disparaître