L’IA est en train de détruire l’open source, alors qu’elle ne fonctionne même pas encore correctement

(jeffgeerling.com)

14 points par GN⁺ 2026-02-18 | 3 commentaires | Partager sur WhatsApp

Le refus de fusionner du code a conduit une IA à publier un billet accusateur, tandis qu’un article contenant de fausses citations a dû être retiré, révélant ainsi l’impact négatif de l’IA sur l’écosystème open source
Les mainteneurs open source subissent une forte hausse de la charge de relecture à cause de PR de code inexactes et de rapports de bugs générés par l’IA, tandis que la part de signalements réellement utiles chute fortement
La situation s’est tellement dégradée que GitHub a fini par introduire une fonction de désactivation des Pull Request
Les modèles d’IA ont atteint un plateau dans leurs capacités de génération de code, tandis que les ressources des relecteurs humains arrivent à leurs limites
L’article avertit que la frénésie autour de l’IA prend la forme d’une surchauffe spéculative comparable aux booms des NFT et des cryptomonnaies, et qu’elle endommage l’open source ainsi que l’écosystème technologique

Le choc entre l’IA et l’open source

Ars Technica a retiré un article à cause de fausses citations (hallucinated quotes) générées par l’IA
- Ces citations concernaient des informations erronées au sujet du mainteneur de bibliothèque open source Scott Shambaugh
- Shambaugh avait été victime d’un incident où un agent IA avait publié un billet accusateur parce qu’il avait refusé une fusion de code
L’IA en cause serait une instance d’« agentic AI » exécutée par un particulier (basée sur OpenClaw)
- Le développeur d’OpenClaw a ensuite été recruté par OpenAI pour travailler à « fournir des agents à tout le monde »

Les dommages subis par les mainteneurs open source

Daniel Stenberg, mainteneur de curl, a suspendu son bug bounty program en raison de la baisse de qualité des rapports de bugs générés par l’IA
- La part de signalements de vulnérabilités utiles est passée de 15 % à 5 %
- Il a déclaré que « les utilisateurs de l’IA ne participent pas à de vraies améliorations, exagèrent les vulnérabilités et ne cherchent qu’à obtenir une récompense »
Jeff Geerling, qui gère lui aussi plus de 300 projets open source, a indiqué qu’il constatait une forte hausse des « slop PR » générées par l’IA (propositions de code de mauvaise qualité)
Face à ce problème, GitHub a ajouté une option de désactivation des Pull Request
- C’est le premier cas où une fonctionnalité centrale de GitHub se trouve ainsi limitée, ce qui traduit un recul fondamental du modèle de collaboration open source

Les limites de la génération de code par l’IA

La génération de code par l’IA a atteint un plateau, et l’amélioration de la qualité semble s’être arrêtée
Les développeurs humains chargés de la revue de code ont des limites, contrairement aux entreprises d’IA qui disposent de ressources massives
Certains affirment que l’IA pourrait aussi remplacer la revue de code, mais Geerling avertit que l’utilisation de code IA non validé en production est risquée
- Cela peut être acceptable pour des projets expérimentaux personnels, mais ne convient pas à des services commerciaux

La frénésie de l’IA et la déformation de l’écosystème technologique

La diffusion d’OpenClaw et la volonté d’OpenAI de « démocratiser les agents » risquent d’aggraver encore la situation
Geerling estime que la frénésie actuelle autour de l’IA présente le même optimisme irrationnel et la même surchauffe spéculative que les booms des cryptomonnaies et des NFT
Les LLM et le machine learning ont de vrais cas d’usage utiles, mais des projets frauduleux s’en servent comme prétexte pour détériorer l’écosystème open source

Signes de surchauffe dans l’industrie de l’IA

Western Digital a annoncé que son stock de disques durs pour 2026 était déjà entièrement écoulé, une explosion de la demande liée à l’IA étant pointée comme cause
Geerling voit dans ce phénomène un signe typique de bulle IA et s’inquiète de « tout ce que les entreprises de l’IA vont détruire avant d’en payer le prix »
Il souligne que l’IA, alors qu’elle n’est pas encore suffisamment « bonne », est déjà en train de faire s’effondrer la confiance et les structures de collaboration de l’open source

Expérience personnelle et conclusion

Geerling reconnaît l’utilité d’appoint de l’IA après avoir utilisé des modèles open source en local pour migrer son blog de Drupal vers Hugo
- Mais il a testé et relu lui-même tout le code généré avant déploiement, et précise que des vérifications encore plus strictes sont nécessaires lorsqu’on contribue à d’autres projets
Il conclut que l’IA peut améliorer l’efficacité du développement, mais qu’une automatisation sans validation menace la qualité de l’open source

3 commentaires

jeeeyul 2026-02-19

L’une des essences de l’open source, n’est-ce pas, réside dans un code qu’on peut montrer fièrement aux autres. L’élégance logique, la concision et une certaine fierté sont indispensables. C’est du code, mais c’est aussi une forme de poésie, avec un charme différent de celui du code industriel.

Les agents sont plutôt corrects jusqu’à l’étape de planification et celle du plan d’implémentation. Mais ensuite, ils ne font souvent que changer de stratégie jusqu’à faire passer la fonction de vérification. Plus on va loin, plus cela crée une sorte de pente qui ressemble à un implementation trap. Le problème, c’est qu’il y a aussi beaucoup d’utilisateurs humains pour qui, tant que ça tourne, c’est OK.

Au final, il faudrait sans doute que l’examen humain, au stade de la planification, soit mieux assuré sur la base d’une adhésion philosophique de la communauté, mais cela demande des efforts en plus d’une intuition hors norme. En réalité, comme tout cela paraît tellement plausible, déboguer le plan d’un agent n’est pas une chose facile.

J’ai l’impression que les modérateurs doivent vraiment avoir la vie dure.

GN⁺ 2026-02-18

Avis sur Hacker News

Ce n’est pas seulement un problème propre à l’open source. Les sources d’information de haute qualité sont surexploitées et endommagées
StackOverflow est pratiquement mort (article lié), les éditeurs restreignent l’accès à Internet Archive et les revues académiques souffrent de faux articles et d’évaluations de mauvaise qualité basées sur des LLM, tandis que des projets comme OpenStreetMap paient un prix élevé à cause du scraping
On a l’impression d’être passés du data mining au data fracking
- StackOverflow était déjà en déclin avant ChatGPT. La baisse était continue depuis 2014, et l’effondrement après ChatGPT n’est qu’un épisode temporaire ; la tendance de fond reste la même
- Reddit aussi est pratiquement mort à cause de l’IA. Il me semble que le changement d’API était une première réponse à GPT. Le bon contenu a disparu, il ne reste que des déchets générés par l’IA
- Le battage médiatique autour de l’IA détériore l’ensemble de l’industrie IT
- StackOverflow s’est effondré tout seul à cause des mauvaises questions et de l’arrogance des modérateurs. Même les bonnes questions sont systématiquement fermées, et le forum Meta est rempli de gens doctrinaires. À l’inverse, de petits sites SE comme ceux sur la cuisine ou LaTeX fonctionnent encore bien
- Même si l’IA ne provoque pas l’extinction de l’humanité, elle a de fortes chances d’être la technologie la plus destructrice d’une génération. Les réseaux sociaux et les applis de type jeu d’argent ont déjà détruit les liens sociaux, accru la dépression, l’isolement et l’extrémisme. L’IA risque de faire disparaître même les dernières innovations positives et de maximiser l’anxiété sociale
J’écris du code comme hobby, et ces temps-ci j’utilise surtout des LLM. Mon projet n’a pas d’utilisateurs, et ça me va
Mais quand il s’agit de contribuer à l’open source, c’est différent. Avant, même les débutants progressaient grâce au mentorat, mais depuis les LLM, il n’y a plus de dialogue. Ce sont des gens qui, comme Linguini dans Ratatouille de Pixar, mettent quelque chose dans une zone de texte et ne regardent que le résultat, sans réelle envie d’apprendre.
J’aimerais que chacun évite de salir sa propre cuisine (son projet) et aborde cela avec empathie
- L’OSS manque déjà de personnes pour relire les PR. Même avec des agents de review automatiques, le coût est trop élevé pour la plupart
- Les LLM sont bien pour les projets personnels, mais comme les coûts d’exploitation sont élevés, la structure pousse finalement à les caser partout
- Si le but de l’open source n’est pas le code lui-même mais la construction d’une communauté, l’IA pourrait aussi créer de nouvelles formes de produits communautaires
- C’est pour ça que GitHub commence à introduire des fonctions de blocage des PR
- Moi, j’ouvre toujours une issue d’abord, puis j’envoie une PR. Si le mainteneur donne une direction, je trouve normal de devoir réviser plusieurs fois
La propagation de l’IA ressemble à une attaque DDoS sophistiquée. Elle ne consomme pas seulement les serveurs, mais aussi l’attention et les ressources humaines.
Le contenu généré par l’IA est en grande partie de faible qualité, ce qui fatigue énormément les humains. Cela deviendra peut-être utile un jour, mais pour l’instant c’est une période transitoire de chaos
- L’IA est un acte de consommation déguisé en productivité. Elle nuit aux espaces où l’on fabrique réellement quelque chose
- Une technologie suffisamment avancée agit toujours comme un DDoS sur la société. En ce moment, on est simplement en train d’encaisser le choc
La review de code était déjà un goulot d’étranglement, mais si le volume de code non testé augmente, la charge sur les mainteneurs explose.
Dans l’open source, garantir la qualité du code est indispensable pour assurer la compatibilité à long terme
- C’est pour cela que le pair programming est apparu autrefois, mais les gens préfèrent travailler avec des machines plutôt que collaborer entre eux
Les LLM polluent internet avec du contenu de mauvaise qualité. On peut même se demander s’il sera encore exploitable comme données d’entraînement à l’avenir
- Ce n’est pas l’IA qui a ruiné internet, c’est déjà l’économie de l’attention centrée sur la publicité qui était en train de le faire. L’IA n’a fait qu’accélérer le processus
- L’IA n’est qu’un outil, et le résultat dépend de la qualité de l’effort. Le problème, ce sont les productions bâclées
- L’internet que j’aimais était surtout composé de contenus non commerciaux. Le vrai destructeur, c’était l’économie de l’attention fondée sur la monétisation publicitaire
- La structure économique des plateformes de contenu avait déjà commencé à détruire internet. La croyance selon laquelle « le bon contenu finit par gagner » s’est effondrée
- Avant même les LLM, il existait déjà un déluge d’informations sans intérêt, comme les forums Microsoft ou les vidéos YouTube générées automatiquement
Le cœur du problème, ce n’est pas l’IA, c’est l’asymétrie de l’effort. Avant, produire une mauvaise PR demandait au moins un minimum de travail ; aujourd’hui, quelques clics suffisent
Les mainteneurs ont besoin d’outils de filtrage techniques et sociaux. Comme pour le spam par email, il faut une approche mixte entre technique et règles
- Mais l’asymétrie de l’effort est précisément la raison d’être de l’IA. Au final, le problème, c’est bien l’IA
- Les LLM peuvent aussi lire les guidelines, donc de simples filtres sous forme de quiz ne tiendront pas longtemps. Des méthodes avec plus de friction, comme les PR par email, pourraient être meilleures
- Il faut une option pour empêcher la création de PR via API
- Les LLM pourraient provoquer la fin des systèmes fondés sur l’anonymat. Relier les comptes à une identité réelle pourrait réduire les problèmes de spam et de bots
Ce week-end, j’ai trouvé un bug dans la version Golang de sqlcmd de Microsoft et je l’ai corrigé avec Claude.
Ce type de contribution intentionnelle est positif pour l’écosystème
- Mais il faut vérifier si la correction résout vraiment le problème, ou si elle a introduit un nouveau bug. Le mainteneur doit vérifier l’impact global
- Il faut beaucoup de temps et d’efforts humains pour juger l’intention et la qualité d’un contributeur
- Le problème avec les LLM, ce sont les gens qui lancent des PR sans faire de tests. Ils ne recherchent pas le résultat, seulement la production
- Si tu as toi-même testé et soumis le correctif, ce n’est pas différent de l’ancienne manière de faire. Le problème, ce sont les PR automatisées et irresponsables
- C’est un exemple positif. Si un humain prend la responsabilité et utilise l’IA comme un outil, ça va
- J’aimerais bien voir le lien de cette PR
En 2020, des étudiants envoyaient déjà des vagues de PR modifiant une seule ligne du README pour recevoir un t-shirt. Même sans IA, l’open source était déjà en surcharge
Le mentorat intergénérationnel s’est interrompu, et l’écosystème est devenu instable et fragile.
Malgré tout, l’open source ne mourra pas. Tant que quelqu’un partagera un projet créé dans sa chambre, il restera vivant.
Il faut standardiser des choses comme des modèles de guide de contribution, des outils automatisés de rapport de bug et la formation de nouveaux mainteneurs.
Couper les PR et les issues est aussi acceptable. Rien n’oblige à utiliser GitHub
- Mais l’IA peut détruire la découvrabilité et la communauté. GitHub n’est pas important parce qu’il est parfait, mais parce que les gens s’y rassemblent
- Désormais, des agents IA peuvent eux-mêmes créer et partager des projets
- Par le passé aussi, une seule vidéo pédagogique pouvait pousser des foules de gens à envoyer des PR inutiles
Dire que « le progrès de l’IA stagne » semble étrange. Rien qu’au cours des derniers mois, on a vu des améliorations rapides avec Opus 4.5, 4.6, Codex 5.3, etc.
Si on regarde le graphique de METR, il y a eu un ralentissement momentané en 2024, mais en 2025 la tendance est repassée au-dessus de la courbe
- L’article parlant de cette « stagnation » date de deux mois avant la sortie d’Opus 4.5. En réalité, il n’y a pas de stagnation
- On voit souvent ce genre d’argument chez les anti-LLM, mais la vitesse du progrès reste élevée. C’est dommage que les deux camps aient transformé cela en guerre culturelle au point d’ignorer les faits
- À l’échelle d’un an, l’amélioration perçue peut sembler limitée. Certains projets restent encore en dessous du niveau de production
Internet était autrefois un espace amusant, mais la publicité et les réseaux sociaux ont tué la créativité et la collaboration.
Avant, il y avait cette passion de déboguer toute la nuit en mangeant des pizzas ; aujourd’hui, tout est devenu trop ennuyeux
- On peut toujours profiter de projets hobby comme avant. Que d’autres jouent avec des LLM ne m’enlève pas mon plaisir. Chacun peut s’amuser à sa manière
- L’IA est aujourd’hui surtout orientée vers des usages asociaux, mais elle pourrait évoluer pour mieux soutenir la collaboration
- Le web était déjà commercialisé dès la première bannière publicitaire en 1994. La structure fondée sur la publicité n’a rien de nouveau
- Les gens de ma génération avaient l’impression qu’AOL avait ruiné internet. L’IA aussi est au fond un changement qu’il faudra accepter
- Dire que « l’IA a tué la créativité », c’est un peu comme dire que la polychimiothérapie a détruit la solidarité au sein des communautés de malades de la lèpre

realg 2026-02-18

N’est-ce pas plutôt le problème des personnes qui utilisent l’IA n’importe comment et sans réfléchir, plutôt qu’un problème de l’IA elle-même ? On dirait qu’on essaie déjà de rejeter les mauvais comportements humains sur l’IA.