35 points par GN⁺ 2025-07-10 | 1 commentaires | Partager sur WhatsApp
  • Avec la hausse récente de l’écriture assistée par LLM, on remarque de plus en plus de schémas d’écriture peu naturels
  • Phrases de résumé pauvres, usage excessif des puces, rythme de phrase monotone : ce sont des problèmes typiques de l’écriture produite par LLM
  • Une faible densité informationnelle et des formulations vagues apparaissent souvent, ce qui tend à appauvrir les véritables enseignements du texte
  • À l’inverse, la répétition intentionnelle, les formulations de balisage et la structure parallèle sont parfois prises à tort pour un style LLM, alors qu’il s’agit en réalité d’outils d’écriture efficaces
  • L’auteur souligne que, même s’il utilise les LLM pour concevoir des plans, générer des brouillons et réécrire certaines parties, le jugement final et la construction d’un contenu profond restent du ressort de l’humain

Common Patterns of Bad Writing I See from LLM Tools

  • En écrivant et relisant depuis quelques années divers articles techniques et billets de blog, l’auteur ressent souvent dans les textes issus de LLM une impression subtilement « maladroite et moins engageante »
  • En même temps, il constate aussi que l’usage des LLM l’aide énormément pour rédiger des brouillons, résumer des documents complexes et mettre de l’ordre dans des idées dispersées
  • Dans cet article, il partage les mauvais schémas d’écriture souvent générés par les LLM, les habitudes d’écriture souvent prises à tort pour du « style LLM » alors qu’elles sont tout à fait valables, ainsi que les règles de rédaction et de prompt qu’il utilise réellement

Empty “summary” sentences that pretend to conclude a thought

  • À la fin d’un paragraphe, on voit souvent apparaître des phrases de résumé qui ont l’air de conclure mais ne disent en réalité rien de concret, comme « By following these steps, we achieve better performance. » ou « By internalizing these principles, you can cut through the noise. »
    • « En suivant ce processus, on peut obtenir de meilleures performances »
    • « En intégrant ces principes, on peut dépasser la confusion ambiante »
  • Ce type de phrase n’apporte au lecteur ni éclairage nouveau ni matière à réflexion
  • L’auteur lui-même dit ne pas avoir encore trouvé de méthode fiable pour amener un LLM à produire ce genre de phrase porteuse d’un vrai message

Overuse of bullet points and outlines

  • Les LLM ont tendance à abuser des puces (listes) et des plans
  • Les listes sont utiles quand les éléments sont parallèles et indépendants, mais quand les idées sont liées entre elles ou que le contexte compte, le paragraphe est souvent plus approprié

Flat sentence rhythm

  • Quand toutes les phrases répètent une longueur et une structure similaires, le texte devient monotone et plus difficile à suivre

  • Faire varier la longueur et le rythme des phrases permet de mieux mettre l’accent, relancer l’attention et contrôler la cadence

    • Bad example:
      "We recently launched a conversational AI feature that lets users ask questions in plain English and get responses based on their past activity and current session. The system searches a database of help articles, ranks the most relevant ones using a custom scoring function, and passes the top result into a language model to generate the final answer. We spent weeks optimizing each step to keep latency under 300 milliseconds, including caching, pruning irrelevant articles, and tuning prompt templates."
      "Nous avons récemment lancé une fonctionnalité d’IA conversationnelle qui permet aux utilisateurs de poser des questions en langage courant et d’obtenir des réponses fondées sur leur activité passée et la session en cours. Le système interroge une base d’articles d’aide, sélectionne les éléments les plus pertinents à l’aide d’un algorithme de scoring personnalisé, puis transmet ce résultat à un modèle de langage pour générer la réponse finale. Nous avons consacré plusieurs semaines à optimiser chaque étape afin de maintenir une latence inférieure à 300 millisecondes, notamment avec du caching, la suppression des articles non pertinents et l’optimisation des modèles de prompt"

    • Good example:
      "We just launched a new conversational AI feature. It answers user questions in plain language, using context from the current session. The system searches help articles, scores them with a custom ranking function, feeds the top result into a fine-tuned language model, and runs in under 300ms using caching, pruning, and prompt tuning techniques."
      "Nous venons de lancer une nouvelle fonctionnalité d’IA conversationnelle. Elle répond aux questions des utilisateurs en langage simple, en s’appuyant sur le contexte de la session en cours. Le système recherche des articles d’aide, les évalue avec une fonction de classement personnalisée, injecte le meilleur résultat dans un modèle de langage fine-tuned, et fonctionne en moins de 300 ms grâce au caching, au filtrage et au prompt tuning"

Not the right subject

  • Quand le choix du sujet est inadapté, le cœur de la phrase devient flou
    • Bad example:
      "Readers are better guided when the subject matches the main idea of the sentence."
      "Le lecteur est mieux guidé lorsque le sujet correspond à l’idée principale de la phrase"
    • Good example:
      "Choosing the right subject keeps the writing clear and focused."
      "Choisir le bon sujet permet de garder un texte clair et centré"
  • Bien choisir le sujet est important pour la cohérence et la concentration du texte

Low information density

  • Voici un exemple de texte généré par LLM obtenu avec Gemini 2.5 Pro :

    "As someone who writes, reviews, and deconstructs complex information for a living, I’ve developed a strong allergy to bad writing. And lately, a lot of that bad writing has a specific, synthetic flavor—the unmistakable scent of an LLM. This post is a guide to navigating the new world of writing, with or without LLM assistance. First, I’ll cover the true pitfalls of LLM-generated text—the red flags that make it feel sterile and unconvincing."
    "Comme je passe ma vie à écrire, relire et déconstruire des informations complexes, j’ai développé une forte allergie à la mauvaise écriture. Et dernièrement, une bonne partie de cette mauvaise écriture a une saveur particulière, synthétique — l’odeur unmistakable d’un LLM. Cet article est un guide pour naviguer dans le nouveau monde de l’écriture, avec ou sans assistance LLM. Je vais d’abord passer en revue les véritables pièges du texte généré par LLM — les signaux qui lui donnent un caractère stérile et peu convaincant."

  • La structure des phrases et la grammaire sont parfaites, mais il manque de vrais enseignements, des informations concrètes et une progression de l’argumentation

Vagueness

  • Les textes de LLM ont une forte tendance à éviter la précision
  • Ils présentent des idées sans les définir clairement, avancent des affirmations sans preuve, ou restent vagues sur les personnes concernées
    “Some experts say prompt engineering is becoming less important. The ability to simply prompt LLMs can have a major impact on productivity.”
    “Certains experts disent que le prompt engineering devient moins important. La simple capacité à écrire des prompts pour des LLM peut avoir un impact majeur sur la productivité”
    → Il manque des éléments concrets et un public cible clair : qui le dit, dans quel contexte, et pour qui cela change réellement quelque chose

Overuse of demonstrative pronouns

  • L’usage excessif de pronoms démonstratifs comme "this", "that", "these", "those" est fréquent
  • Si le nom auquel ils renvoient n’est pas clair, le lecteur peut facilement perdre le fil
    “This creates friction in production.”
    “Cela crée des frictions en production”
    Ici, il n’est pas clair de quoi "this" / « cela » parle exactement

Fluency without understanding

  • On voit souvent des phrases apparemment fluides mais en réalité peu explicatives
    “LLMs use attention mechanisms to generate contextually appropriate responses.”
    “Les LLM utilisent des mécanismes d’attention pour générer des réponses adaptées au contexte”
    → Si le lecteur ne sait pas ce qu’est l’attention, cette phrase ne transmet en fait aucune information utile
  • Les LLM inventent aussi fréquemment des termes qui n’existent pas
    “We used GPT-4 for summarization, but it hallucinated details, so we added retrieval grounding.”
    “Nous avons utilisé GPT-4 pour le résumé, mais il a halluciné des détails, donc nous avons ajouté du retrieval grounding”
    → « retrieval grounding » n’est pas un terme réellement établi
  • Les LLM ne savent pas bien distinguer le niveau de connaissance du lecteur ni le besoin d’explication, et ont donc tendance à escamoter les passages difficiles

Writing Patterns People Flag as “LLM-Like,” But Are Actually Fine

  • Il existe aussi des schémas d’écriture que l’on soupçonne trop facilement d’être du style LLM, alors qu’ils sont en réalité efficaces et tout à fait courants
  • L’essentiel n’est pas d’écrire un texte qui n’a pas l’air produit par un modèle, mais un texte clair, intentionnel et maîtrisé

Intentional repetition

  • La répétition peut être très efficace pour clarifier ou souligner une idée complexe
    "Vector databases store embeddings, or mathematical representations that capture semantic meaning in hundreds of dimensions. In other words, vector databases help find results that are “close” in meaning, not just exact text matches."
    « Les bases de données vectorielles stockent des embeddings, c’est-à-dire des représentations mathématiques qui capturent le sens sémantique dans des centaines de dimensions. Autrement dit, les bases de données vectorielles aident à trouver des résultats “proches” par le sens, et pas seulement des correspondances textuelles exactes »

Signposting phrases

  • Des formulations de balisage comme "essentially", "in short" ou "the point is..." sont utiles si elles sont suivies d’une information réelle
    Exemple :
    "Essentially, instead of classifying the document as a whole, we classify each section independently."
    « En substance, au lieu de classer le document dans son ensemble, on classe chaque section indépendamment »

Parallel structure

  • La structure parallèle aide à organiser les idées et à rendre le flux de la phrase plus fluide
    "The system scales across inputs, stays responsive under load, and returns consistent results even with noisy prompts."
    « Le système passe à l’échelle sur des entrées variées, reste réactif sous charge et renvoie des résultats cohérents même avec des prompts bruités »

Section headings that echo a structure

  • Des intertitres à structure prévisible comme « Why X fails », « What to do instead » ou « How to know if it worked » sont parfaitement efficaces si le contenu est clair

Declarative openings

  • Commencer une section par une phrase déclarative ferme peut au contraire renforcer la focalisation du texte, à condition qu’elle soit soutenue par des preuves ou des explications
    Exemple :
    "LLM evaluations are hard to get right. Many rely on user-defined gold labels or vague accuracy metrics, which do not work for subjective or multi-step tasks."
    « Il est difficile de bien évaluer les LLM. Beaucoup d’évaluations reposent sur des gold labels définis par les utilisateurs ou sur des métriques de précision vagues, qui ne conviennent pas aux tâches subjectives ou en plusieurs étapes »

Em dashes

  • Le tiret cadratin (—) est utile pour les incises, les variations de rythme ou les transitions rapides à l’intérieur d’une phrase
  • Bien utilisé, il aide à produire un flux plus naturel, proche de l’oral, et à mieux marquer l’insistance

How I Write with LLMs

  • Pour l’auteur, l’élément le plus important dans l’écriture est de conserver l’élan
  • En pratique, son processus de travail pour un article ou un billet de blog ressemble généralement à ceci
    • planifier l’outline (sur papier ou mentalement)
    • générer un brouillon
    • relire et examiner de manière critique ce qui a été écrit
    • réviser
  • Ce processus peut se répéter à différentes échelles, de la phrase à la section entière
  • Selon les personnes, le point de blocage n’est pas le même entre la planification, la rédaction du brouillon et la révision
    • l’auteur construit rapidement ses plans, mais bloque souvent sur la formulation (phrasing)
    • il utilise donc activement les LLM comme outil pour dépasser les blocages et accélérer la mise en forme d’un brouillon

Narrate the story to the model

  • Au démarrage d’un brouillon, il écrit une version grossière de l’idée comme s’il expliquait la structure à un collègue, puis la colle dans le LLM en demandant la génération d’un outline détaillé
  • Il répète ce processus jusqu’à ce que la structure lui paraisse claire

Write the paragraph myself, even if it’s rough

  • Une fois l’outline prêt, il essaie de rédiger lui-même chaque paragraphe, même si c’est encore brut
  • Lorsqu’il a du mal à finir une phrase, il peut demander au LLM quelque chose comme “finish it”, choisir la meilleure proposition parmi plusieurs, puis la retoucher légèrement si nécessaire
    “In the last couple of years, I’ve written and reviewed several technical papers and blog posts. Something always feels slightly off, enough to make the writing quietly uninviting. At the same time, I feel like I get tremendous value from using LLMs to write…” “finish it”
    “Ces dernières années, j’ai écrit et relu plusieurs articles techniques et billets de blog. Il y a toujours quelque chose qui sonne légèrement faux, assez pour rendre le texte discrètement peu engageant. En même temps, j’ai l’impression de tirer une immense valeur de l’usage des LLM pour écrire…” “finish it”
    → Le modèle propose plusieurs suites, puis l’auteur choisit la meilleure et la retouche légèrement avant de continuer

Use scoped rewrite strategies during revision

  • Quand un paragraphe ou une phrase semble maladroit, il ne demande pas « make it better », mais fournit au LLM une consigne précise ou un schéma ciblé (par exemple une structure rhétorique)
  • Exemples de stratégies :
    • placer le sujet et le verbe aussi tôt et aussi près que possible dans la phrase
    • utiliser la structure SWBST (qui voulait quoi, mais à cause de quel obstacle, comment a-t-il réagi, et quel a été le résultat)
      • Exemple :
        "We used GPT-4 for summarization. We wanted fluent answers, but it hallucinated facts. So we added a retrieval step. Then we re-ranked outputs based on citation accuracy."
        « Nous avons utilisé GPT-4 pour le résumé. Nous voulions des réponses fluides, mais il a halluciné des faits. Nous avons donc ajouté une étape de retrieval. Ensuite, nous avons reclassé les sorties selon la précision des citations »
      • La structure SWBST est efficace, y compris dans l’écriture technique, pour transmettre de façon concise la motivation, le problème, la réponse apportée et le résultat

Parting Thoughts

  • Nous sommes désormais dans une époque où il est facile de produire avec un LLM un texte de niveau intermédiaire (de qualité moyenne)
  • Mais décider quoi écrire, quel point de vue et quelle structure adopter, et où il faut approfondir reste encore du ressort de l’humain
  • Un très bon texte doit apporter une contribution réelle à la hauteur de sa longueur et mériter le temps que le lecteur y consacre
  • C’est ce critère que l’auteur cherche à atteindre

1 commentaires

 
crawler 2025-07-10

Je pense que GeekNews est appréciable de ce point de vue, parce que la densité d'information y est élevée.
Le fait que ça se termine en style télégraphique donne vraiment l'impression d'une optimisation maximale de la densité.