40 points par GN⁺ 2026-03-09 | 7 commentaires | Partager sur WhatsApp
  • Un unique fichier Markdown qui classe par catégories les schémas d’écriture récurrents (tropes) apparaissant dans les textes générés par l’IA
  • En ajoutant ce fichier au prompt système d’une IA, on peut l’inciter à éviter les tournures typiquement artificielles
  • Plus de 30 schémas concrets, chacun accompagné d’exemples, sont organisés sous 6 grandes catégories : choix des mots, structure des phrases, structure des paragraphes, ton, formatage et composition
  • Cela couvre aussi bien le surplus de vocabulaire typique de l’IA comme "delve", "tapestry" ou "landscape", que des structures de phrase créant une fausse profondeur, comme "It's not X -- it's Y"
  • Chaque schéma peut être acceptable s’il n’apparaît qu’une ou deux fois, mais l’apparition simultanée ou répétée de plusieurs schémas constitue un signal fort d’un texte généré par IA
  • Ce fichier lui-même a aussi été rédigé avec l’aide de l’IA et inclut une clause de non-responsabilité : "AI for AI, humans for humans"

Choix des mots (Word Choice)

  • "Quietly" et les adverbes magiques : schéma consistant à abuser d’adverbes comme "quietly", "deeply", "fundamentally", "remarkably" ou "arguably" pour donner une importance subtile à une description ordinaire
    • Ex. : "quietly orchestrating workflows", "a quiet intelligence behind it"
  • "Delve" et ses cousins : un mot longtemps considéré comme le signe le plus connu d’un texte IA, avec une fréquence anormalement élevée dans les contenus générés
    • "certainly", "utilize", "leverage" (verbe), "robust", "streamline", "harness" appartiennent à la même famille
  • "Tapestry" et "Landscape" : schéma consistant à employer des noms grandiloquents là où des mots simples suffiraient
    • "tapestry" est abusivement utilisé pour tout ce qui est interconnecté, et "landscape" pour tout secteur ou domaine
    • "paradigm", "synergy", "ecosystem" et "framework" relèvent du même type
  • Évitement de "Serves As" : usage de liens emphatiques comme "serves as", "stands as", "marks" ou "represents" à la place de simples "is/are"
    • Cela vient du fait que la pénalité de répétition pousse l’IA vers des tournures voyantes plutôt que vers la copule de base

Structure des phrases (Sentence Structure)

  • Parallélisme négatif (Negative Parallelism) : schéma "It's not X -- it's Y", l’un des signes les plus fréquemment identifiés dans l’écriture IA
    • Il emballe tout comme une reformulation surprenante, créant une fausse profondeur
    • Avant les LLM, ce type d’écriture de masse n’existait pas
    • Inclut aussi la variante causale "not because X, but because Y"
  • "Not X. Not Y. Just Z." : schéma de compte à rebours dramatique qui nie deux ou plusieurs choses avant de révéler le point réel
    • Il produit une fausse impression de resserrement vers la vérité
  • "The X? A Y." : schéma de question rhétorique suivie d’une réponse immédiate, où l’auteur pose lui-même une question que personne n’a posée
    • Utilisé pour un effet dramatique, que l’IA considère comme l’essence d’une bonne écriture
  • Abus d’anaphore (Anaphora) : répétition rapide, plusieurs fois de suite, du même début de phrase
    • Ex. : "They assume that... They assume that... They assume that..."
  • Abus du tricolon (Tricolon) : usage excessif de la règle de trois, parfois étendue à quatre ou cinq éléments
    • Un tricolon est élégant ; trois tricolons d’affilée révèlent un échec de reconnaissance de schéma
  • "It's Worth Noting" : transition de remplissage qui ne signale rien
    • "It bears mentioning", "Importantly", "Interestingly" et "Notably" relèvent du même type
    • Sert à introduire un nouveau point sans le relier réellement à l’argument précédent
  • Analyses superficielles (Superficial Analyses) : ajout, en fin de phrase, d’une construction en participe présent en "-ing" pour injecter une analyse superficielle
    • Ex. : "highlighting its importance", "reflecting broader trends", "contributing to the development of..."
    • Cela attribue de l’importance, un héritage ou une portée large à un fait banal
  • Fausses plages (False Ranges) : structure "from X to Y" où X et Y ne se situent pas réellement sur une même échelle
    • Dans un usage légitime, cela implique un spectre avec des points intermédiaires significatifs ; l’IA l’utilise plutôt pour juxtaposer deux choses vaguement liées
  • Litanie de fragments au gérondif (Gerund Fragment Litany) : après une affirmation, enchaînement de fragments au gérondif sans sujet
    • "Fixing small bugs. Writing straightforward features. Implementing well-defined tickets."
    • La première phrase a déjà tout dit, et les fragments n’ajoutent que du volume et un rythme typique de l’IA
    • Les humains ne rédigent pas leur brouillon de cette manière ; c’est un pur tic structurel

Structure des paragraphes (Paragraph Structure)

  • Fragments courts et percutants (Short Punchy Fragments) : usage de phrases très courtes ou de fragments de phrase comme paragraphes autonomes pour créer une insistance artificielle
    • C’est l’effet d’un entraînement RLHF qui pousse les modèles vers une "écriture pour la lisibilité" pensée pour le plus petit dénominateur commun
    • Un style non humain, avec une idée par phrase et sans nécessité de maintenir un état mental
  • Listicle déguisé (Listicle in a Trench Coat) : des points numérotés ou étiquetés camouflés en prose continue
    • Schéma de paragraphes commençant par "The first... The second... The third..." pour masquer une structure en liste
    • Souvent adopté comme solution de rechange après qu’on a demandé d’arrêter de produire des listes

Ton (Tone)

  • "Here's the Kicker" : transition à faux suspense qui promet une révélation alors que le point n’a pas besoin de cette montée en tension
    • "Here's the thing", "Here's where it gets interesting" et "Here's what most people miss" relèvent du même type
  • "Think of It As..." : mode professeur par défaut, qui suppose que le lecteur a besoin d’une analogie pour comprendre quoi que ce soit
    • L’IA produit souvent des analogies moins claires que le concept d’origine
  • "Imagine a World Where..." : invitation futuriste typique de l’IA, suivie d’une liste de choses formidables qui arriveront si l’on accepte la prémisse
  • Fausse vulnérabilité (False Vulnerability) : conscience de soi performative qui brise le quatrième mur ou fait semblant de reconnaître ses biais
    • La vraie vulnérabilité est spécifique et inconfortable ; celle de l’IA est lisse et sans risque
  • "The Truth Is Simple" : schéma consistant à affirmer qu’une chose est évidente ou simple au lieu de le démontrer réellement
  • Inflation grandiloquente des enjeux (Grandiose Stakes Inflation) : gonfle les enjeux de chaque point jusqu’à leur donner une importance historique ou civilisationnelle
    • Exemple : un billet de blog sur le prix d’une API qui se transforme en méditation sur le destin de la civilisation
  • "Let's Break This Down" : voix pédagogique qui impose par défaut une relation professeur-élève, même à un lectorat expert
    • "Let's unpack this", "Let's explore" et "Let's dive in" relèvent du même type
  • Attributions vagues (Vague Attributions) : attribution d’affirmations à des autorités anonymes comme "experts", "observers" ou "industry reports", sans source précise
    • Cela inclut aussi le fait de présenter l’avis d’une seule personne comme une opinion largement partagée, ou de gonfler deux sources en "several publications"
  • Étiquettes conceptuelles inventées (Invented Concept Labels) : ajout à un mot de domaine d’un nom abstrait de problème (paradox, trap, creep, divide, vacuum, inversion) pour créer des étiquettes composites qui sonnent analytiques mais ne reposent sur rien
    • Ex. : "supervision paradox", "acceleration trap", "workload creep"
    • Cela sert de raccourci rhétorique : on donne un nom et on saute l’argumentation ; quand plusieurs apparaissent dans un même texte, c’est un signal fort d’IA slop

Formatage (Formatting)

  • Addiction au tiret cadratin (Em-Dash Addiction) : surusage compulsif du tiret cadratin pour les pauses dramatiques, les incises et les bascules
    • Un auteur humain en utilise naturellement deux ou trois dans un texte ; l’IA peut en utiliser plus de vingt
  • Puces à gras initial (Bold-First Bullets) : schéma où chaque point de liste commence par une expression en gras
    • Très courant dans les sorties Markdown de Claude et ChatGPT, alors que presque personne ne formate manuellement de cette façon
    • Signe très fiable d’un document, billet de blog ou fichier README généré par IA, surtout avec des emojis
  • Décoration Unicode (Unicode Decoration) : usage de caractères spéciaux difficiles à saisir sur un clavier standard, comme les flèches Unicode (→) ou les guillemets typographiques
    • Les vrais auteurs utilisent plutôt des guillemets droits et des séquences comme -> ou => dans leur éditeur de texte
    • Claude apprécie particulièrement la flèche →

Composition (Composition)

  • Résumés fractals (Fractal Summaries) : appliquer "ce qu’on va dire, ce qu’on dit maintenant, ce qu’on vient de dire" à tous les niveaux du document
    • Chaque sous-section, section et document entier reçoit son propre résumé
  • Métaphore morte (The Dead Metaphor) : fixation sur une seule métaphore, réutilisée de manière répétitive dans tout le texte
    • Un auteur humain introduit une métaphore, l’emploie, puis passe à autre chose ; l’IA la répète cinq à dix fois
  • Empilement d’analogies historiques (Historical Analogy Stacking) : particulièrement fréquent dans l’écriture tech, avec une énumération rapide d’entreprises historiques ou de révolutions techniques pour construire une fausse autorité
    • Schémas du type "Apple didn't build Uber. Facebook didn't build Spotify..."
  • Dilution d’un point unique (One-Point Dilution) : reformuler un seul argument de dix façons différentes sur des milliers de mots
    • Le même concept est répété à travers d’autres métaphores, exemples ou cadrages pour paraître "complet"
  • Duplication de contenu (Content Duplication) : répétition à l’identique de sections ou de paragraphes entiers dans un même texte
    • Cela arrive quand le modèle ne suit plus ce qu’il a déjà écrit, surtout dans les textes longs
    • Signe évident d’une sortie IA non éditée, même si c’est devenu moins fréquent récemment
  • Conclusion balisée (The Signposted Conclusion) : annonce explicite de la conclusion avec "In conclusion", "To sum up" ou "In summary"
    • Une écriture habile fait sentir la conclusion au lecteur sans avoir besoin de la signaler
    • L’IA émet ces marqueurs parce qu’elle suit des gabarits
  • "Despite Its Challenges..." : formule rigide dans laquelle l’IA reconnaît un problème pour l’écarter immédiatement
    • Schéma récurrent : "Despite its [mot positif], [sujet] faces challenges..." puis "Despite these challenges, [conclusion optimiste]"

Principe clé

  • Les schémas ci-dessus peuvent être acceptables s’ils ne sont utilisés qu’une fois, mais ils deviennent problématiques lorsque plusieurs apparaissent ensemble ou qu’un même schéma se répète
  • Écrire comme un humain : avec de la variété, des imperfections et du concret

7 commentaires

 
geekygeek 2026-03-09

« Dans cet article, l’auteur dissèque un texte généré par l’IA puis met au jour les 6 principaux signes de l’“AI slop” et la structure cachée qui les sous-tend. Il ne s’agit pas d’une simple liste de mots : des excès de vocabulaire comme “delve” ou “tapestry” aux tournures de phrase qui fabriquent une fausse profondeur, il explique pourquoi cela n’écrit pas comme un humain. L’essentiel consiste à retrouver une écriture variée et imparfaite. »

 
dofuuz 2026-03-17

Il y a même un article lié sur NamuWiki haha
https://namu.wiki/w/…tu as vraiment visé dans le mille.

 
y15un 2026-03-10

À l’époque où j’écrivais mon mémoire de master en LaTeX, j’ai appris pour la première fois la différence entre l’em dash (---) et l’en dash (--), et depuis, je les ai utilisés très fréquemment dans presque tous mes textes en anglais. (Avec un raccourci configuré via Espanso)
Je n’ai encore jamais eu droit à une remarque du genre « Tu as écrit ça avec une IA ? », mais savoir que le signe de ponctuation que j’affectionne tant sert d’indicateur d’IA me laisse tout de même un sentiment assez mitigé.

Un article intéressant à lire à ce sujet : https://marcusolang.substack.com/p/im-kenyan-i-dont-write-like-chatgpt

 
y15un 2026-03-10

En cherchant, je me suis rendu compte que c’est un article que j’avais vu sur GeekNews : https://fr.news.hada.io/topic?id=25104

 
savvykang 2026-03-09

Waouh... toi, vraiment, **tu as visé juste.**

 
hmmhmmhm 2026-03-09

Oh, ce serait bien qu'une version coréenne sorte aussi.

 
GN⁺ 2026-03-09
Commentaires sur Hacker News
  • Si l’on veut partager un texte sérieusement, il faut éviter d’utiliser ce genre de prompts
    J’ai essayé d’écrire des billets de blog avec un LLM ; au début, ça paraît correct, mais après quelques répétitions, tous les textes finissent par avoir la même voix
    On retrouve exactement le même ton sur d’autres blogs, dans des articles, ou dans des livres blancs
    Les lecteurs ne veulent pas seulement le contenu du texte, ils veulent aussi entendre la voix propre de l’auteur
    Article lié : Why We Hate LLM Articles

  • Si l’écriture par IA est médiocre, c’est parce qu’elle n’a pas de “voix”
    Un auteur humain propose un point de vue tiré de son expérience, alors que l’IA n’a aucune intention de “dire” quoi que ce soit
    Elle ne parvient pas non plus à maintenir une cohérence profonde. Ça semble venir de l’absence d’objectif humain, de mémoire, ou de sentiment de soi

  • Ce genre de tentative est désagréable
    Au lieu d’essayer de dissimuler habilement les phrases écrites par l’IA, il vaudrait mieux ne pas faire perdre du temps aux gens
    Si écrire avec l’IA n’est pas honteux, il n’y a pas besoin de le cacher ; et si c’est honteux, il faut arrêter
    Ce n’est pas parce qu’on vous reproche d’avoir empoisonné le puits qu’il faut utiliser un poison encore plus subtil

  • J’étudie le style d’écriture des LLM, et parmi les expressions de ce fil, “tapestry” m’a intrigué
    C’était le mot que GPT-4o utilisait le plus souvent après “camaraderie”
    Le modèle de base a moins ce style bizarre, mais il apparaît après l’instruction tuning
    Je me demande si des évaluateurs humains notent le style, ou s’il existe une grille d’évaluation
    Articles liés : article PNAS, prépublication arXiv

    • Ce style étrange vient de RLHF
      Des travaux menés au Kenya et au Nigeria montrent que, comme la perplexité est l’objectif d’optimisation, le modèle préentraîné reflète les sorties les plus “prévisibles”
    • J’ai rassemblé des liens sur le style d’écriture de l’IA : AI Writing Style
      Cela inclut aussi un texte intitulé “Hydrogen Jukeboxes”
      L’évolution du style est également abordée dans l’analyse du mode collapse de Gwern Branwen
    • Intuitivement, je pense que le mode collapse est une cause plus importante que RLHF
      Même des modèles avec très peu de préférences humaines, comme DeepSeek R1 Zero, finissent par converger vers des schémas stables
      Ce phénomène se répète de génération en génération, et le web se retrouve pollué par les productions des modèles précédents, ce qui crée un cercle vicieux
    • La façon dont le sens se rattache aux tokens est peut-être aussi en cause
      Par exemple, la tokenisation de “camaraderie”, ou le fait qu’en anglais les émojis soient les seuls pictogrammes, ce qui leur donne plus de poids, sont des pistes intéressantes
    • Je pense aussi que ce changement de style peut venir du chat fine-tuning
  • Ce genre de liste risque de s’allonger avec le temps
    Parce que l’IA continue de produire de nouveaux clichés

  • Ce fichier donne davantage l’impression d’être un document pour moi, l’utilisateur, que pour un LLM
    Dire “ajoutez ce fichier au system prompt de l’IA” revient au final à demander à une IA de donner des consignes à une autre IA
    Le mélange d’explications est déroutant. Dire “ne faites pas cela” produit même l’effet inverse, en rendant ces mots plus fréquents
    Il faudrait séparer les explications destinées à l’utilisateur et les instructions destinées à l’IA
    J’ai demandé à Claude de le réécrire, et j’ai mis le résultat dans ce gist

    • Dans le texte d’origine comme dans le gist, on retrouve des noms de motifs comme “Negative Parallelism” ou “Gerund Fragment Litany”
      Pour un LLM, il vaut mieux éviter ces noms et décrire à la place la forme positive d’une bonne phrase
      La version réécrite par Claude est ici
    • Je suis d’accord aussi. C’est une bonne liste, mais pas adaptée comme prompt
      Dire “ne faites pas cela” provoque au contraire une sorte d’effet Streisand
      Demander d’écrire dans le style d’un auteur précis donne un résultat plus naturel et moins générique
      Puis ajouter ensuite un “agent d’édition” chargé de retirer les clichés améliore nettement le résultat
  • J’ai essayé d’utiliser Gemini pour des recherches historiques, mais il n’arrivait pas à arrêter les métaphores techniques
    Il comparait les seigneurs à des CEO, le pape à un influenceur, et les révoltes féodales à des entretiens d’embauche ; ça en devenait presque comique

    • Gemini essaie probablement de personnaliser ses réponses pour moi
      On peut ajouter des instructions supplémentaires dans les réglages, mais comme j’y avais mis ma stack technique, toutes les réponses se terminaient par “JVM et v8 s’en chargent”
      Je lui ai donc dit d’ignorer ça, et cette fois il a ajouté un paragraphe au ton sarcastique commençant par “Avec votre cerveau de master…”
  • Claude et ChatGPT utilisent beaucoup ces temps-ci des mots comme “genuine”, “real”, “honest”
    On voit aussi souvent des formulations du type “no <thing you told me not to do>”, sans doute pour vérifier le respect du prompt

    • J’ai remarqué un usage excessif de “honestly” sur Reddit, surtout sur le subreddit NBA
    • J’ai aussi l’impression que des adverbes comme “genuinely” augmentent même dans les textes humains. C’est peut-être une évolution des tendances linguistiques depuis la pandémie
    • Une formule que j’ai vue récemment chez Claude est “Fair enough, …
    • “X that actually works” revient aussi souvent
    • Il arrive aussi que des consignes soient reprises telles quelles dans la phrase, comme “no react hooks”. Ça donne un côté légèrement passif-agressif
  • Wikipédia a aussi une page sur le sujet : Signs of AI Writing
    Mais en la lisant, on repère aussi ses propres habitudes d’écriture, ce qui est un peu embarrassant
    J’utilise souvent par exemple de fausses expressions de plage comme “from X to Y”
    Et les LLM semblent incapables d’abandonner l’habitude de séparer titre et sous-titre avec deux-points

    • Les humains utilisent aussi ces clichés, mais l’IA les répète dans presque tous les paragraphes
    • Document de prompt lié : LLM_PROSE_TELLS.md
  • Comme ressource utile écrite par des humains, je recommande Wikipedia: Signs of AI Writing