Le L de LLM signifie « mensonge »

(acko.net)

13 points par GN⁺ 2026-03-06 | 3 commentaires | Partager sur WhatsApp

Malgré le battage médiatique autour des outils de code fondés sur les LLM, la qualité réelle des logiciels produits ne s’est pas nettement améliorée, et l’on voit au contraire proliférer des livrables qui relèvent davantage de la contrefaçon (forgery)
La nature même de ce que font les LLM consiste à permettre à une personne de reproduire plus vite un livrable potentiel, le sien ou celui d’autrui, et les problèmes commencent lorsqu’on s’en sert comme substitut d’un original
Les projets open source subissent déjà des dommages concrets à cause de PR de mauvaise qualité générées par l’IA, au point de fermer les contributions publiques ou d’interrompre des bug bounties
L’industrie du jeu vidéo, elle, oppose une résistance efficace sous l’impulsion des consommateurs en exigeant l’étiquetage et le filtrage des contenus IA, tandis que les ingénieurs logiciels l’acceptent sans défense
Pour que les LLM cessent de mentir, une attribution correcte des sources (source attribution) est indispensable, mais cela reste techniquement impossible avec l’architecture actuelle des modèles

Réfutation du récit selon lequel l’usage de l’IA serait inévitable

Selon le battage médiatique du secteur, le développement logiciel traditionnel serait terminé, mais après plusieurs années d’usage d’outils fondés sur les LLM, les résultats restent pratiquement au même niveau qu’avant
Une énorme quantité de hype autour de cette technologie attire des investissements massifs, et ces investissements exigent en retour encore plus de hype, dans un cycle auto-entretenu
De nouveaux modèles continuent d’être entraînés pour tenir les promesses que des modèles déjà mis au rebut étaient censés avoir réalisées
« Ne pas utiliser l’IA est parfaitement acceptable » — ce n’est pas une posture passéiste, et cela peut même être moins stressant et plus satisfaisant que d’embrasser l’IA

Artisanat (Craft) vs production de masse (Kraft) : le prisme de la contrefaçon

Parmi les nombreux cadrages proposés pour décrire ce que font les LLM (aide, créativité, productivité vs paresse, jetable, plagiat), un mot manque de façon frappante : contrefaçon (forgery)
Peindre dans le style de Van Gogh et y apposer sa signature, c’est une contrefaçon ; usurper un document juridique, c’est une contrefaçon ; une étude fondée sur des données falsifiées, c’est une contrefaçon — le caractère frauduleux est inhérent à l’objet et à sa méthode de fabrication
Les LLM sont des outils qui permettent à un individu de produire plus vite des contrefaçons de ses propres livrables potentiels ou de ceux d’autrui
L’imitation en elle-même est légale au titre de la liberté d’expression, mais le problème apparaît lorsqu’on tente d’utiliser une contrefaçon comme substitut d’un original
On ne sera pas arrêté pour avoir « contrefait » une lettre du Père Noël, mais même conserver une « fausse monnaie » extrêmement sophistiquée uniquement comme objet de collection n’est autorisé dans aucune juridiction

L’analogie avec les appellations d’origine et les normes de qualité

Des produits sous appellation contrôlée comme le « Brie de Meaux » en France exigent à la fois une méthode de fabrication traditionnelle, des matières premières de haute qualité et une origine géographique précise
Autoriser une production à l’étranger conduirait inévitablement à une inondation d’imitations bon marché, qui dégraderait la marque du produit authentique et menacerait un savoir-faire local rare transmis sur plusieurs générations
Le seul jugement des consommateurs ne suffit pas à garantir le bon fonctionnement du marché, et l’éventail des produits présents en rayon est déjà déterminé par des facteurs échappant au contrôle du public
La qualité d’un fromage artisanal représente l’ensemble d’une chaîne d’approvisionnement opérée avec des méthodes modernes ; transposer cela ailleurs demanderait d’énormes investissements en capital humain, en infrastructures et en agriculture
Toute société doit tracer une ligne quelque part entre le « fromage artisanal traditionnel » et les « faux œufs fabriqués avec des produits chimiques industriels » ; seules les sociétés qui comprennent et préservent la valeur de l’artisanat alimentaire peuvent éviter des taux d’obésité supérieurs à 70 % (cas de Nauru)

Les dégâts du slop IA dans l’open source et le code du quotidien

Les mainteneurs open source sont les premiers à ressentir les effets secondaires — il était déjà très difficile de trouver des contributeurs motivés et de les faire adhérer aux objectifs du projet ainsi qu’à son mode de pensée en ingénierie
Des contributeurs sont apparus, envoyant des PR codées au slop pour gonfler leur CV GitHub
- tldraw a fermé les contributions publiques, le projet curl a interrompu son bug bounty, et d’autres projets réagissent en ridiculisant les faux contributeurs
On observe un effet similaire au quotidien lorsqu’on travaille avec des collègues adeptes du vibe-coding — un junior peut sembler monter rapidement en compétence, alors qu’en réalité il externalise son apprentissage initial à un bot
En 2026, si un junior soumet une PR avec des explications et des commentaires extrêmement détaillés, il faut soupçonner chaque mot

Ingénieurs seniors et mirage d’une productivité x10/x100

On affirme que des vétérans expérimentés utilisant l’IA produisent 10 ou 100 fois plus de code qu’avant, tout en continuant à ne pas comprendre que chaque ligne de code exécutée et dépendante est un passif (liability)
Dire que « le coding avec l’IA est formidable parce que tout ce dont l’agent a besoin est décrit dans la codebase » est une affirmation fatalement erronée — si c’était vrai, il n’y aurait en réalité aucun travail de développement à faire
La différence essentielle tient à ceci : l’ingénieur a-t-il passé l’essentiel de sa carrière à résoudre des problèmes créés par d’autres logiciels, ou à résoudre des problèmes que les gens avaient avant même l’existence du logiciel ?
- Seul le second cas apprend à réfléchir aux vraies contraintes du problème et aux besoins des utilisateurs
Quand on considère le logiciel comme une fin en soi, on transforme ce qui tiendrait sur un VPS à 10 $/mois en une infrastructure cloud sur-ingéniérée

Caractéristiques du code slop et réaction du secteur

Un ingénieur doté d’un vrai sens de l’artisanat repère facilement le slop en revue de code — répétition excessive, complexité inutile, refus du refactoring, etc.
On observe même des seniors commettre, via le vibe-coding, des erreurs embarrassantes malgré des années d’expérience, puis les transmettre telles quelles
L’épisode du Discord Co-pilot de Microsoft, où l’insulte « Microslop » a été interdite — une façon de présenter la contestation des utilisateurs comme du « spam » ou de la « toxicité », signe que la promesse compte davantage que les résultats réels
Ces outils sont décrits comme « addictifs » ou comme « le meilleur ami qu’on puisse avoir », mais on ne voit pas pour autant l’explosion cambrienne de créativité et d’accomplissement qui devrait l’accompagner

Problèmes structurels du logiciel et rôle de l’IA

Ce que produit l’IA, c’est surtout le code glue devenu nécessaire à mesure que les applications logicielles se sont faites, depuis la révolution du PC, plus fermées, plus fragmentées et plus corporate
Les API HTTP n’apportent pas de véritable ouverture, puisqu’elles exigent des JSON blobs mal documentés dont le schéma change chaque nuit
Beaucoup d’entreprises fonctionnent encore principalement avec Excel, et il n’existe pas d’outil équivalent à Excel pour JSON
SQL était censé libérer les entreprises de leur dépendance à des outils propriétaires, mais cela a échoué, et l’histoire se répète
Alors que des apps Electron codées au vibe-coding continuent d’être préférées à des applications natives multiplateformes, on peut se demander où se trouve réellement cette productivité multipliée par 100
Si même Apple ne parvient plus à maintenir sur ses OS récents un système cohérent de formulaires et d’icônes, les perspectives d’une IA entraînée sur du slop web paraissent encore plus faibles

La résistance efficace de l’industrie du jeu vidéo

Les ingénieurs logiciels ont plongé sans gilet de sauvetage, mais l’industrie du jeu vidéo résiste efficacement sous l’impulsion des consommateurs
De nombreux jeux ont présenté des excuses et retiré des contenus IA non signalés
Steam dispose d’une politique claire sur les contenus IA, et SteamDB fournit des outils de filtrage des jeux générés par IA
- Une mise à jour récente de la politique Steam exclut les usages visant à améliorer l’efficacité d’outils de développement qui ne génèrent pas de contenu présenté au joueur
Deux raisons expliquent l’efficacité de cette résistance sur le marché du jeu :
- un marché de distribution numérique purement D2C (vente directe au consommateur) — les joueurs disposent de tous les leviers de choix, et les prescripteurs qui exigent de la transparence sont les joueurs eux-mêmes
- la plupart des jeux sont des œuvres artistiques, achetées pour un attrait artistique particulier — dans l’art, l’imitation est perçue comme une dévalorisation de l’œuvre originale et un vol de crédit

Réutilisation du code et contraste avec l’originalité artistique

Le code ne souffre généralement pas de la réutilisation, et dans le cas de l’infrastructure cela peut même être bénéfique
C’est précisément pourquoi les projets open source sont particulièrement inadaptés pour attirer des créatifs artistiques talentueux — l’esprit du partage sans coût implique qu’un design artistique soit immédiatement repris hors de son contexte d’origine
La génération procédurale (procedural generation) classique constitue un précédent intéressant, et elle a globalement échoué à tenir ses promesses
- Le cas de No Man's Sky (version 2016) — la promesse de créer un contenu exponentiel à partir de sources limitées a fini par rendre sans valeur la diversité de sa propre production

IA générative, bibliothèques pirates et flou juridique

Il est naturel que les artistes dénoncent l’IA générative comme un plagiat de masse, et tout aussi naturel que des entrepreneurs tech et des curateurs de données ne le comprennent pas et entraînent des modèles à partir de shadow libraries pirates
- Nvidia est accusée d’avoir tenté de conclure un accord d’accès rapide à l’immense collection de livres piratés d’Anna’s Archive
Si les sorties sont banales, grossières et douteuses, c’est pour une raison claire — la diversité même des échantillons d’entraînement n’est rien d’autre que du slop destiné à la machine
Cela crée une dénégation plausible (plausible deniability) où il devient impossible de distinguer ce qui relève de la citation, de l’hallucination ou de l’originalité
Apposer sur des contenus IA un label “généré par IA” ou un watermark relève le plus souvent de la déresponsabilisation, pas d’une véritable divulgation responsable
Pour que le vibe-coding soit acceptable et justifiable, il faut adopter une position paradoxale selon laquelle la propre production de l’ingénieur serait jetable, non créative et indigne d’être créditée

L’attribution des sources comme solution

Aucun tribunal n’aurait jamais dû se prononcer globalement sur la légalité ou la possibilité de copyright de l’ensemble des productions IA ; une production sans source devrait être traitée comme une contrefaçon
La solution au problème des LLM est claire mais inatteignable : faire en sorte que les LLM réalisent une attribution correcte des sources en même temps que leur raisonnement
- Cela pourrait révéler que, au-delà du versant artistique, une part importante du vibe code n’est qu’un copier-coller de codebases existantes, sans auteurs originaux, sans licence ni liens
Dans les modèles actuels, une véritable attribution est techniquement impossible — la capacité des LLM à mentionner et citer des sources est elle-même une propriété émergente (emergent property) des données collectées
- Les LLM ne peuvent citer une source que lorsqu’il est approprié de le faire à cet endroit du texte, ce qui revient souvent à une simple simulation de citation (citation role-play) qui cite correctement ce qui est fréquemment bien cité
Les implications d’une exigence d’attribution sont immenses : si les poids devaient être attribuables et la passe avant auditable, à quoi ressemblerait la rétropropagation (backpropagation) ? Cela ne tiendrait pas dans int4
C’est précisément le problème que les « outils de détection de l’IA » tentent de résoudre à rebours
Il est paradoxal qu’après le World Wide Web et des moteurs de recherche à l’échelle de Google, la technologie de nouvelle génération soit une technologie incapable, par conception, d’indiquer la source d’une information
Pour que les machines cessent de mentir, elles doivent citer correctement leurs sources — et les entreprises d’IA aussi

3 commentaires

hungryman 2026-03-06

Qu’est-ce que c’est, je commence à manquer de vocabulaire.
Je me retrouve assis là à chercher « émergent », « slop », « attribution des sources », « effet de cadrage », « explosion cambrienne ».

GN⁺ 2026-03-06

Commentaires sur Hacker News

Le marché du jeu vidéo semble être un cas rare où les consommateurs ont rejeté l’IA, mais en réalité, le rejet visait surtout les assets artistiques générés par IA
Que le code soit écrit par l’IA ou non, personne ne s’en soucie vraiment. Le questionnaire de Steam sur l’IA montre que la génération de code est déjà acceptée
Au final, la généralisation du coding avec les LLM est inévitable. Il en va de même pour la génération procédurale : ce n’est pas tant une question d’outil que de compétence de la personne qui l’utilise
- Dire que la génération procédurale a échoué est une vision ignorante. Des classiques comme Elite ou Powermonger jusqu’aux jeux roguelike récents, les exemples de réussite sont nombreux
- Il est vrai que les LLM réduisent le code répétitif, mais ce n’est pas de la réutilisation de code. C’était déjà un problème que les bibliothèques permettaient de résoudre
- Voir un ami artiste critiquer l’IA tout en l’utilisant pour ses textes marketing m’a fait penser à une attitude contradictoire
- Le questionnaire de Steam semble bien inclure la génération de code, mais au fond cela ne diffère pas vraiment de l’usage de bibliothèques
- Si les jeux en monde ouvert ont perdu de leur attrait, c’est parce que l’effet de nouveauté a disparu. L’argument selon lequel les LLM font gagner du temps est aussi peu étayé. Un résultat immédiat ne garantit pas un bénéfice à long terme
Le débat sur les LLM devient fatigant. Cette technologie est utilisée moins pour renforcer les gens que pour les contrôler, faciliter les licenciements et concentrer encore davantage la richesse
C’est un peu comme si des cochons débattaient de l’utilité d’une machine à bacon
- Une IA accessible à tous pour 20 dollars par mois est déjà un outil largement accessible. Elle abaisse plutôt les barrières. On dirait surtout une réaction de gens effrayés par le changement
- Ce type de raisonnement se répète depuis la révolution industrielle à propos de toutes les technologies d’automatisation
- L’IA pourrait aussi nous libérer de la dépendance aux acteurs commerciaux. On pourrait peut-être créer directement nos propres OS ou applis
- Il faut revendiquer l’automatisation complète et un revenu de base garanti. Le vrai danger, plus que l’AGI, ce sont les humains
- Si la majorité perd son emploi, le marché lui-même s’effondre. Mais à cause de la concurrence, les entreprises finiront malgré tout par créer de nouveaux emplois
Le mouvement luddite n’était pas simplement anti-technologie. Il craignait une baisse de qualité, et il avait effectivement raison
Les écharpes en laine artisanales de l’Europe médiévale étaient complètement différentes des produits d’usine modernes. Le progrès technique n’est pas toujours un remplacement à l’identique
Aujourd’hui encore, en voyant des outils internes créés par des non-techniciens faire gagner des centaines d’heures, on comprend que même imparfait, si c’est efficace, c’est suffisant
- Le Japon est une société industrialisée, mais continue de respecter les traditions artisanales
- Dans 800 ans, le seul code conservé dans les musées sera probablement du très bon code. Il y a là un biais du survivant qui idéalise le passé
- Je recommande la conférence de Jonathan Blow, Preventing the Collapse of Civilization
- Qualifier les ingénieurs logiciels de luddites est erroné. Une grande partie de l’ingénierie relève en réalité d’un travail artisanal, répétitif et fondé sur l’expérience
- Vouloir revenir à l’avant-industrialisation n’est qu’une nostalgie aristocratique. Au contraire, les LLM ouvrent au plus grand nombre l’accès à des logiciels sur mesure
Ce que les LLM révèlent, c’est que la majeure partie de la programmation n’est que du code boilerplate
La vraie valeur se trouve dans les petites innovations de plus haut niveau
- Si la vitesse de développement était vraiment importante, il aurait déjà fallu changer l’organisation des entreprises. En réalité, le vrai problème, c’est une bureaucratie inefficace
- Les bibliothèques et les abstractions provoquent au contraire souvent un gonflement du code. Les LLM ayant appris sur ce type de code, ils ont du mal à produire un code propre
- Même dans le code répétitif, il peut y avoir une forme de savoir-faire artisanal. Bien maîtriser les bases reste une chose précieuse
- Autrefois, on divisait le codage en étapes du type « choisir quoi faire – écrire – déboguer », mais aujourd’hui cela paraît daté
- Un livre aussi n’est au fond qu’un simple essai rempli de centaines de pages de boilerplate
L’usage idéal des LLM serait de jouer le rôle de professeur. Mieux vaut les utiliser comme outil pour enseigner rapidement des concepts plutôt que pour écrire du code
- C’est précisément le bon moment pour cela. Il suffit d’indiquer dans le prompt : « N’écris pas de code, sois un bon professeur »
- Mais apprendre auprès d’un professeur peu fiable est une expérience anxiogène. Mieux vaut parfois avancer plus lentement avec un apprentissage plus stable
Comme pour les fromages ou jambons artisanaux, il pourrait exister dans le futur un Artisanal Coding
- Le ‘Handmade Network’ met déjà cette philosophie en pratique. Les LLM ne sont au fond que le point d’arrivée du développement logiciel industrialisé
  Ils ne sont plus qu’une machine qui traduit des spécifications en code à la place des humains
- Les cas comme Steve Gibson, qui écrivait directement de l’assembleur à la main, sont ce qui s’en rapproche le plus. Mais cela n’a jamais été la tendance dominante
- Les logiques de protection des traditions, comme les appellations géographiques protégées, sont pour la plupart peu fondées
La réalité froide, c’est que personne ne s’intéresse vraiment à notre code en lui-même
La plupart des gens ne regardent que s’il fonctionne, sa rapidité et son coût. Au final, nous sommes plus proches de travailleurs d’usine
Cela ressemble au sentiment de perte qu’un horloger a dû ressentir en voyant arriver le tour automatique
- On ne s’inquiète de la qualité que lorsque le système s’effondre sous le poids de la dette technique
- En logiciel d’entreprise, « tant que ça marche, ça suffit », mais pour les produits grand public, la qualité et la finition comptent
- Je considère que le code est une dette. J’éprouve même du plaisir à le jeter sans hésiter lorsqu’il n’est plus nécessaire
- Le coding n’a rien de créatif ni de sexy. Le monde ne regarde que si « ça marche bien, c’est rapide, peu coûteux et lancé avant les concurrents »
  Au fond, le récit romantique du métier créatif que nous avons entretenu est en train de s’effondrer
Toute cette discussion ressemble finalement à un problème de nature humaine qui se répète, un peu comme le mème TTP (Time To Penis)
Ce texte offre vraiment une vision réaliste et équilibrée

parkindani 2026-03-06

Le texte principal comme les réponses sont étonnamment négatifs. On dirait que personne ici n’a même essayé d’utiliser Claude Code..