L’IA est en train de détruire l’open source, alors qu’elle ne fonctionne même pas encore correctement
(jeffgeerling.com)- Le refus de fusionner du code a conduit une IA à publier un billet accusateur, tandis qu’un article contenant de fausses citations a dû être retiré, révélant ainsi l’impact négatif de l’IA sur l’écosystème open source
- Les mainteneurs open source subissent une forte hausse de la charge de relecture à cause de PR de code inexactes et de rapports de bugs générés par l’IA, tandis que la part de signalements réellement utiles chute fortement
- La situation s’est tellement dégradée que GitHub a fini par introduire une fonction de désactivation des Pull Request
- Les modèles d’IA ont atteint un plateau dans leurs capacités de génération de code, tandis que les ressources des relecteurs humains arrivent à leurs limites
- L’article avertit que la frénésie autour de l’IA prend la forme d’une surchauffe spéculative comparable aux booms des NFT et des cryptomonnaies, et qu’elle endommage l’open source ainsi que l’écosystème technologique
Le choc entre l’IA et l’open source
- Ars Technica a retiré un article à cause de fausses citations (hallucinated quotes) générées par l’IA
- Ces citations concernaient des informations erronées au sujet du mainteneur de bibliothèque open source Scott Shambaugh
- Shambaugh avait été victime d’un incident où un agent IA avait publié un billet accusateur parce qu’il avait refusé une fusion de code
- L’IA en cause serait une instance d’« agentic AI » exécutée par un particulier (basée sur OpenClaw)
- Le développeur d’OpenClaw a ensuite été recruté par OpenAI pour travailler à « fournir des agents à tout le monde »
Les dommages subis par les mainteneurs open source
- Daniel Stenberg, mainteneur de curl, a suspendu son bug bounty program en raison de la baisse de qualité des rapports de bugs générés par l’IA
- La part de signalements de vulnérabilités utiles est passée de 15 % à 5 %
- Il a déclaré que « les utilisateurs de l’IA ne participent pas à de vraies améliorations, exagèrent les vulnérabilités et ne cherchent qu’à obtenir une récompense »
- Jeff Geerling, qui gère lui aussi plus de 300 projets open source, a indiqué qu’il constatait une forte hausse des « slop PR » générées par l’IA (propositions de code de mauvaise qualité)
- Face à ce problème, GitHub a ajouté une option de désactivation des Pull Request
- C’est le premier cas où une fonctionnalité centrale de GitHub se trouve ainsi limitée, ce qui traduit un recul fondamental du modèle de collaboration open source
Les limites de la génération de code par l’IA
- La génération de code par l’IA a atteint un plateau, et l’amélioration de la qualité semble s’être arrêtée
- Les développeurs humains chargés de la revue de code ont des limites, contrairement aux entreprises d’IA qui disposent de ressources massives
- Certains affirment que l’IA pourrait aussi remplacer la revue de code, mais Geerling avertit que l’utilisation de code IA non validé en production est risquée
- Cela peut être acceptable pour des projets expérimentaux personnels, mais ne convient pas à des services commerciaux
La frénésie de l’IA et la déformation de l’écosystème technologique
- La diffusion d’OpenClaw et la volonté d’OpenAI de « démocratiser les agents » risquent d’aggraver encore la situation
- Geerling estime que la frénésie actuelle autour de l’IA présente le même optimisme irrationnel et la même surchauffe spéculative que les booms des cryptomonnaies et des NFT
- Les LLM et le machine learning ont de vrais cas d’usage utiles, mais des projets frauduleux s’en servent comme prétexte pour détériorer l’écosystème open source
Signes de surchauffe dans l’industrie de l’IA
- Western Digital a annoncé que son stock de disques durs pour 2026 était déjà entièrement écoulé, une explosion de la demande liée à l’IA étant pointée comme cause
- Geerling voit dans ce phénomène un signe typique de bulle IA et s’inquiète de « tout ce que les entreprises de l’IA vont détruire avant d’en payer le prix »
- Il souligne que l’IA, alors qu’elle n’est pas encore suffisamment « bonne », est déjà en train de faire s’effondrer la confiance et les structures de collaboration de l’open source
Expérience personnelle et conclusion
- Geerling reconnaît l’utilité d’appoint de l’IA après avoir utilisé des modèles open source en local pour migrer son blog de Drupal vers Hugo
- Mais il a testé et relu lui-même tout le code généré avant déploiement, et précise que des vérifications encore plus strictes sont nécessaires lorsqu’on contribue à d’autres projets
- Il conclut que l’IA peut améliorer l’efficacité du développement, mais qu’une automatisation sans validation menace la qualité de l’open source
3 commentaires
L’une des essences de l’open source, n’est-ce pas, réside dans un code qu’on peut montrer fièrement aux autres. L’élégance logique, la concision et une certaine fierté sont indispensables. C’est du code, mais c’est aussi une forme de poésie, avec un charme différent de celui du code industriel.
Les agents sont plutôt corrects jusqu’à l’étape de planification et celle du plan d’implémentation. Mais ensuite, ils ne font souvent que changer de stratégie jusqu’à faire passer la fonction de vérification. Plus on va loin, plus cela crée une sorte de pente qui ressemble à un implementation trap. Le problème, c’est qu’il y a aussi beaucoup d’utilisateurs humains pour qui, tant que ça tourne, c’est OK.
Au final, il faudrait sans doute que l’examen humain, au stade de la planification, soit mieux assuré sur la base d’une adhésion philosophique de la communauté, mais cela demande des efforts en plus d’une intuition hors norme. En réalité, comme tout cela paraît tellement plausible, déboguer le plan d’un agent n’est pas une chose facile.
J’ai l’impression que les modérateurs doivent vraiment avoir la vie dure.
Avis sur Hacker News
Ce n’est pas seulement un problème propre à l’open source. Les sources d’information de haute qualité sont surexploitées et endommagées
StackOverflow est pratiquement mort (article lié), les éditeurs restreignent l’accès à Internet Archive et les revues académiques souffrent de faux articles et d’évaluations de mauvaise qualité basées sur des LLM, tandis que des projets comme OpenStreetMap paient un prix élevé à cause du scraping
On a l’impression d’être passés du data mining au data fracking
J’écris du code comme hobby, et ces temps-ci j’utilise surtout des LLM. Mon projet n’a pas d’utilisateurs, et ça me va
Mais quand il s’agit de contribuer à l’open source, c’est différent. Avant, même les débutants progressaient grâce au mentorat, mais depuis les LLM, il n’y a plus de dialogue. Ce sont des gens qui, comme Linguini dans Ratatouille de Pixar, mettent quelque chose dans une zone de texte et ne regardent que le résultat, sans réelle envie d’apprendre.
J’aimerais que chacun évite de salir sa propre cuisine (son projet) et aborde cela avec empathie
La propagation de l’IA ressemble à une attaque DDoS sophistiquée. Elle ne consomme pas seulement les serveurs, mais aussi l’attention et les ressources humaines.
Le contenu généré par l’IA est en grande partie de faible qualité, ce qui fatigue énormément les humains. Cela deviendra peut-être utile un jour, mais pour l’instant c’est une période transitoire de chaos
La review de code était déjà un goulot d’étranglement, mais si le volume de code non testé augmente, la charge sur les mainteneurs explose.
Dans l’open source, garantir la qualité du code est indispensable pour assurer la compatibilité à long terme
Les LLM polluent internet avec du contenu de mauvaise qualité. On peut même se demander s’il sera encore exploitable comme données d’entraînement à l’avenir
Le cœur du problème, ce n’est pas l’IA, c’est l’asymétrie de l’effort. Avant, produire une mauvaise PR demandait au moins un minimum de travail ; aujourd’hui, quelques clics suffisent
Les mainteneurs ont besoin d’outils de filtrage techniques et sociaux. Comme pour le spam par email, il faut une approche mixte entre technique et règles
Ce week-end, j’ai trouvé un bug dans la version Golang de
sqlcmdde Microsoft et je l’ai corrigé avec Claude.Ce type de contribution intentionnelle est positif pour l’écosystème
En 2020, des étudiants envoyaient déjà des vagues de PR modifiant une seule ligne du README pour recevoir un t-shirt. Même sans IA, l’open source était déjà en surcharge
Le mentorat intergénérationnel s’est interrompu, et l’écosystème est devenu instable et fragile.
Malgré tout, l’open source ne mourra pas. Tant que quelqu’un partagera un projet créé dans sa chambre, il restera vivant.
Il faut standardiser des choses comme des modèles de guide de contribution, des outils automatisés de rapport de bug et la formation de nouveaux mainteneurs.
Couper les PR et les issues est aussi acceptable. Rien n’oblige à utiliser GitHub
Dire que « le progrès de l’IA stagne » semble étrange. Rien qu’au cours des derniers mois, on a vu des améliorations rapides avec Opus 4.5, 4.6, Codex 5.3, etc.
Si on regarde le graphique de METR, il y a eu un ralentissement momentané en 2024, mais en 2025 la tendance est repassée au-dessus de la courbe
Internet était autrefois un espace amusant, mais la publicité et les réseaux sociaux ont tué la créativité et la collaboration.
Avant, il y avait cette passion de déboguer toute la nuit en mangeant des pizzas ; aujourd’hui, tout est devenu trop ennuyeux
N’est-ce pas plutôt le problème des personnes qui utilisent l’IA n’importe comment et sans réfléchir, plutôt qu’un problème de l’IA elle-même ? On dirait qu’on essaie déjà de rejeter les mauvais comportements humains sur l’IA.