- Malgré le battage médiatique autour des outils de code fondés sur les LLM, la qualité réelle des logiciels produits ne s’est pas nettement améliorée, et l’on voit au contraire proliférer des livrables qui relèvent davantage de la contrefaçon (forgery)
- La nature même de ce que font les LLM consiste à permettre à une personne de reproduire plus vite un livrable potentiel, le sien ou celui d’autrui, et les problèmes commencent lorsqu’on s’en sert comme substitut d’un original
- Les projets open source subissent déjà des dommages concrets à cause de PR de mauvaise qualité générées par l’IA, au point de fermer les contributions publiques ou d’interrompre des bug bounties
- L’industrie du jeu vidéo, elle, oppose une résistance efficace sous l’impulsion des consommateurs en exigeant l’étiquetage et le filtrage des contenus IA, tandis que les ingénieurs logiciels l’acceptent sans défense
- Pour que les LLM cessent de mentir, une attribution correcte des sources (source attribution) est indispensable, mais cela reste techniquement impossible avec l’architecture actuelle des modèles
Réfutation du récit selon lequel l’usage de l’IA serait inévitable
- Selon le battage médiatique du secteur, le développement logiciel traditionnel serait terminé, mais après plusieurs années d’usage d’outils fondés sur les LLM, les résultats restent pratiquement au même niveau qu’avant
- Une énorme quantité de hype autour de cette technologie attire des investissements massifs, et ces investissements exigent en retour encore plus de hype, dans un cycle auto-entretenu
- De nouveaux modèles continuent d’être entraînés pour tenir les promesses que des modèles déjà mis au rebut étaient censés avoir réalisées
- « Ne pas utiliser l’IA est parfaitement acceptable » — ce n’est pas une posture passéiste, et cela peut même être moins stressant et plus satisfaisant que d’embrasser l’IA
Artisanat (Craft) vs production de masse (Kraft) : le prisme de la contrefaçon
- Parmi les nombreux cadrages proposés pour décrire ce que font les LLM (aide, créativité, productivité vs paresse, jetable, plagiat), un mot manque de façon frappante : contrefaçon (forgery)
- Peindre dans le style de Van Gogh et y apposer sa signature, c’est une contrefaçon ; usurper un document juridique, c’est une contrefaçon ; une étude fondée sur des données falsifiées, c’est une contrefaçon — le caractère frauduleux est inhérent à l’objet et à sa méthode de fabrication
- Les LLM sont des outils qui permettent à un individu de produire plus vite des contrefaçons de ses propres livrables potentiels ou de ceux d’autrui
- L’imitation en elle-même est légale au titre de la liberté d’expression, mais le problème apparaît lorsqu’on tente d’utiliser une contrefaçon comme substitut d’un original
- On ne sera pas arrêté pour avoir « contrefait » une lettre du Père Noël, mais même conserver une « fausse monnaie » extrêmement sophistiquée uniquement comme objet de collection n’est autorisé dans aucune juridiction
L’analogie avec les appellations d’origine et les normes de qualité
- Des produits sous appellation contrôlée comme le « Brie de Meaux » en France exigent à la fois une méthode de fabrication traditionnelle, des matières premières de haute qualité et une origine géographique précise
- Autoriser une production à l’étranger conduirait inévitablement à une inondation d’imitations bon marché, qui dégraderait la marque du produit authentique et menacerait un savoir-faire local rare transmis sur plusieurs générations
- Le seul jugement des consommateurs ne suffit pas à garantir le bon fonctionnement du marché, et l’éventail des produits présents en rayon est déjà déterminé par des facteurs échappant au contrôle du public
- La qualité d’un fromage artisanal représente l’ensemble d’une chaîne d’approvisionnement opérée avec des méthodes modernes ; transposer cela ailleurs demanderait d’énormes investissements en capital humain, en infrastructures et en agriculture
- Toute société doit tracer une ligne quelque part entre le « fromage artisanal traditionnel » et les « faux œufs fabriqués avec des produits chimiques industriels » ; seules les sociétés qui comprennent et préservent la valeur de l’artisanat alimentaire peuvent éviter des taux d’obésité supérieurs à 70 % (cas de Nauru)
Les dégâts du slop IA dans l’open source et le code du quotidien
- Les mainteneurs open source sont les premiers à ressentir les effets secondaires — il était déjà très difficile de trouver des contributeurs motivés et de les faire adhérer aux objectifs du projet ainsi qu’à son mode de pensée en ingénierie
- Des contributeurs sont apparus, envoyant des PR codées au slop pour gonfler leur CV GitHub
- tldraw a fermé les contributions publiques, le projet curl a interrompu son bug bounty, et d’autres projets réagissent en ridiculisant les faux contributeurs
- On observe un effet similaire au quotidien lorsqu’on travaille avec des collègues adeptes du vibe-coding — un junior peut sembler monter rapidement en compétence, alors qu’en réalité il externalise son apprentissage initial à un bot
- En 2026, si un junior soumet une PR avec des explications et des commentaires extrêmement détaillés, il faut soupçonner chaque mot
Ingénieurs seniors et mirage d’une productivité x10/x100
- On affirme que des vétérans expérimentés utilisant l’IA produisent 10 ou 100 fois plus de code qu’avant, tout en continuant à ne pas comprendre que chaque ligne de code exécutée et dépendante est un passif (liability)
- Dire que « le coding avec l’IA est formidable parce que tout ce dont l’agent a besoin est décrit dans la codebase » est une affirmation fatalement erronée — si c’était vrai, il n’y aurait en réalité aucun travail de développement à faire
- La différence essentielle tient à ceci : l’ingénieur a-t-il passé l’essentiel de sa carrière à résoudre des problèmes créés par d’autres logiciels, ou à résoudre des problèmes que les gens avaient avant même l’existence du logiciel ?
- Seul le second cas apprend à réfléchir aux vraies contraintes du problème et aux besoins des utilisateurs
- Quand on considère le logiciel comme une fin en soi, on transforme ce qui tiendrait sur un VPS à 10 $/mois en une infrastructure cloud sur-ingéniérée
Caractéristiques du code slop et réaction du secteur
- Un ingénieur doté d’un vrai sens de l’artisanat repère facilement le slop en revue de code — répétition excessive, complexité inutile, refus du refactoring, etc.
- On observe même des seniors commettre, via le vibe-coding, des erreurs embarrassantes malgré des années d’expérience, puis les transmettre telles quelles
- L’épisode du Discord Co-pilot de Microsoft, où l’insulte « Microslop » a été interdite — une façon de présenter la contestation des utilisateurs comme du « spam » ou de la « toxicité », signe que la promesse compte davantage que les résultats réels
- Ces outils sont décrits comme « addictifs » ou comme « le meilleur ami qu’on puisse avoir », mais on ne voit pas pour autant l’explosion cambrienne de créativité et d’accomplissement qui devrait l’accompagner
Problèmes structurels du logiciel et rôle de l’IA
- Ce que produit l’IA, c’est surtout le code glue devenu nécessaire à mesure que les applications logicielles se sont faites, depuis la révolution du PC, plus fermées, plus fragmentées et plus corporate
- Les API HTTP n’apportent pas de véritable ouverture, puisqu’elles exigent des JSON blobs mal documentés dont le schéma change chaque nuit
- Beaucoup d’entreprises fonctionnent encore principalement avec Excel, et il n’existe pas d’outil équivalent à Excel pour JSON
- SQL était censé libérer les entreprises de leur dépendance à des outils propriétaires, mais cela a échoué, et l’histoire se répète
- Alors que des apps Electron codées au vibe-coding continuent d’être préférées à des applications natives multiplateformes, on peut se demander où se trouve réellement cette productivité multipliée par 100
- Si même Apple ne parvient plus à maintenir sur ses OS récents un système cohérent de formulaires et d’icônes, les perspectives d’une IA entraînée sur du slop web paraissent encore plus faibles
La résistance efficace de l’industrie du jeu vidéo
- Les ingénieurs logiciels ont plongé sans gilet de sauvetage, mais l’industrie du jeu vidéo résiste efficacement sous l’impulsion des consommateurs
- De nombreux jeux ont présenté des excuses et retiré des contenus IA non signalés
- Steam dispose d’une politique claire sur les contenus IA, et SteamDB fournit des outils de filtrage des jeux générés par IA
- Une mise à jour récente de la politique Steam exclut les usages visant à améliorer l’efficacité d’outils de développement qui ne génèrent pas de contenu présenté au joueur
- Deux raisons expliquent l’efficacité de cette résistance sur le marché du jeu :
- un marché de distribution numérique purement D2C (vente directe au consommateur) — les joueurs disposent de tous les leviers de choix, et les prescripteurs qui exigent de la transparence sont les joueurs eux-mêmes
- la plupart des jeux sont des œuvres artistiques, achetées pour un attrait artistique particulier — dans l’art, l’imitation est perçue comme une dévalorisation de l’œuvre originale et un vol de crédit
Réutilisation du code et contraste avec l’originalité artistique
- Le code ne souffre généralement pas de la réutilisation, et dans le cas de l’infrastructure cela peut même être bénéfique
- C’est précisément pourquoi les projets open source sont particulièrement inadaptés pour attirer des créatifs artistiques talentueux — l’esprit du partage sans coût implique qu’un design artistique soit immédiatement repris hors de son contexte d’origine
- La génération procédurale (procedural generation) classique constitue un précédent intéressant, et elle a globalement échoué à tenir ses promesses
- Le cas de No Man's Sky (version 2016) — la promesse de créer un contenu exponentiel à partir de sources limitées a fini par rendre sans valeur la diversité de sa propre production
IA générative, bibliothèques pirates et flou juridique
- Il est naturel que les artistes dénoncent l’IA générative comme un plagiat de masse, et tout aussi naturel que des entrepreneurs tech et des curateurs de données ne le comprennent pas et entraînent des modèles à partir de shadow libraries pirates
- Nvidia est accusée d’avoir tenté de conclure un accord d’accès rapide à l’immense collection de livres piratés d’Anna’s Archive
- Si les sorties sont banales, grossières et douteuses, c’est pour une raison claire — la diversité même des échantillons d’entraînement n’est rien d’autre que du slop destiné à la machine
- Cela crée une dénégation plausible (plausible deniability) où il devient impossible de distinguer ce qui relève de la citation, de l’hallucination ou de l’originalité
- Apposer sur des contenus IA un label “généré par IA” ou un watermark relève le plus souvent de la déresponsabilisation, pas d’une véritable divulgation responsable
- Pour que le vibe-coding soit acceptable et justifiable, il faut adopter une position paradoxale selon laquelle la propre production de l’ingénieur serait jetable, non créative et indigne d’être créditée
L’attribution des sources comme solution
- Aucun tribunal n’aurait jamais dû se prononcer globalement sur la légalité ou la possibilité de copyright de l’ensemble des productions IA ; une production sans source devrait être traitée comme une contrefaçon
- La solution au problème des LLM est claire mais inatteignable : faire en sorte que les LLM réalisent une attribution correcte des sources en même temps que leur raisonnement
- Cela pourrait révéler que, au-delà du versant artistique, une part importante du vibe code n’est qu’un copier-coller de codebases existantes, sans auteurs originaux, sans licence ni liens
- Dans les modèles actuels, une véritable attribution est techniquement impossible — la capacité des LLM à mentionner et citer des sources est elle-même une propriété émergente (emergent property) des données collectées
- Les LLM ne peuvent citer une source que lorsqu’il est approprié de le faire à cet endroit du texte, ce qui revient souvent à une simple simulation de citation (citation role-play) qui cite correctement ce qui est fréquemment bien cité
- Les implications d’une exigence d’attribution sont immenses : si les poids devaient être attribuables et la passe avant auditable, à quoi ressemblerait la rétropropagation (backpropagation) ? Cela ne tiendrait pas dans
int4
- C’est précisément le problème que les « outils de détection de l’IA » tentent de résoudre à rebours
- Il est paradoxal qu’après le World Wide Web et des moteurs de recherche à l’échelle de Google, la technologie de nouvelle génération soit une technologie incapable, par conception, d’indiquer la source d’une information
- Pour que les machines cessent de mentir, elles doivent citer correctement leurs sources — et les entreprises d’IA aussi
Aucun commentaire pour le moment.