Évolution mensuelle du nombre de questions sur Stack Overflow
(data.stackexchange.com)- Une page de requête de données qui visualise l’évolution du nombre mensuel de questions sur Stack Overflow
- Après un démarrage à quelques milliers à environ 10a0000 questions par mois en 2008, au début du service, environ 150a0000 à 200a0000 questions ont été publiées entre 2014 et 2018, puis, à partir de 2019, le nombre mensuel de questions est passé d’un pic à une tendance baissière
- Entre 2023 et 2025, l’ampleur de la baisse s’accentue encore, et en 2025, le nombre de questions mensuelles tombe à environ 10a0000
- Cela représente une baisse de plus de 90 % par rapport à l’âge d’or
2 commentaires
Je suis curieux de connaître l’avenir de StackOverflow.
Réactions sur Hacker News
J’avais déjà posté sur Stack Overflow une méthode pour calculer la distance minimale entre une ellipse et un point
Lien vers ma réponse
C’est un algorithme que j’ai conçu moi-même ; il tient en quelques lignes de code, mais il converge très rapidement. Je pense que c’est le plus beau code que j’aie écrit de ma vie
À une époque, il y a même eu un article qui le citait, et j’ai entendu dire qu’il avait aussi été utilisé dans un plugin de collision pour Unity. Aujourd’hui, plus personne ne me contacte
Je ne sais même plus où publier ce genre de chose maintenant. C’est un peu bancal pour en faire un article scientifique, et autrefois SO était justement un bon endroit pour publier ça, mais j’ai l’impression que ce dépôt centralisé a disparu
Moi aussi, à l’époque, j’avais posté sur SO une astuce pour empêcher un EKF de devenir singulier, et un professeur m’a dit qu’il m’avait repéré grâce à ça. Ce genre de communauté est difficile à remplacer
Même si tu écris peu, le monde gagne à être enrichi par ce genre de blogs personnels
Et du coup, on se demande où les techniciens pourront encore trouver des problèmes qui stimulent leur créativité
Ce graphique m’a vraiment surpris. Je ne pensais pas que SO avait connu un déclin aussi brutal
C’est encore plus rapide que Britannica, qui a arrêté son édition papier neuf ans après l’arrivée de Wikipédia
Je ne pense pas que les problèmes de SO viennent de sa « modération brutale ». Fondamentalement, c’est surtout qu’il existe désormais d’autres canaux permettant d’obtenir des réponses plus vite
À partir de 2016 environ, Reddit apparaissait souvent dans les résultats de recherche, et on pouvait aussi obtenir des réponses sur Discord
Le coup de grâce a été les LLM. On peut désormais obtenir instantanément des réponses du niveau de SO
Dans ce cas, sur quoi les LLM vont-ils s’entraîner à l’avenir ? Vont-ils continuer à recycler les données de SO de 2014 à 2020 ?
Par exemple, même si une documentation d’API ne couvre pas tous les scénarios détaillés, un LLM peut combiner plusieurs documents pour produire une réponse
Cela dit, pour des écosystèmes spécialisés comme Salesforce ou Workday, les forums restent plus utiles
À l’avenir, les LLM joueront le rôle de collecter et redistribuer ce type d’expérience à grande échelle
L’arrivée des LLM a mis en lumière les problèmes de SO
Des questions étaient fermées injustement, des réponses anciennes n’étaient pas mises à jour, et la culture autoritaire des gros contributeurs était très forte
J’ai le sentiment que les LLM sont bien meilleurs sur ces points
Depuis la sortie de la bêta publique (2020), je l’utilise de plus en plus
Ces deux dernières semaines, j’ai galéré sur un problème de transformation Spark, et les réponses de Gemini et Claude étaient plausibles, mais toutes fausses
J’ai fini par trouver la solution sur SO, ce qui m’a aussi permis d’arriver jusqu’au bon passage de la documentation Spark
Les LLM sont aimables, mais on dirait un ami qui affirme avec assurance des choses fausses
À l’inverse, SO est peu aimable, mais il a réellement résolu mon problème
Les LLM ne peuvent pas remplacer ce type de débat humain ni la profondeur de l’expérience
Avec le temps, ils deviendront progressivement plus précis
Dans mon cas, les LLM montrent un taux de bonnes réponses plus élevé
En programmation, les LLM restent écrasants de rapidité et d’une réactivité immédiate
Si on leur donne plus d’informations, ils corrigent aussitôt et itèrent jusqu’à comprendre complètement le problème
Et en plus, personne n’est sarcastique
Les gens attribueront ce déclin à l’IA, mais en réalité, il s’agissait surtout de la toxicité de la communauté et de problèmes de direction du site
Lien vers un commentaire en doublon
Mais à un certain moment, la plupart des questions avaient déjà trouvé une réponse, et Google menait directement à celle-ci
Les LLM ne sont que « la dernière pièce » posée par-dessus
Changement de CEO en 2020 et création d’un conseil des modérateurs
Je suis d’accord pour dire que SO avait un côté toxique, mais malgré cela, cela reste une immense réussite du savoir ouvert sur Internet
Son influence pour ouvrir la programmation au grand public reste énorme
Vu comme analyste de données, la baisse du nombre de questions est un phénomène naturel
Les questions faciles ont déjà toutes été posées, et les nouvelles deviennent de plus en plus difficiles
Comme ce graphique n’inclut pas les publications supprimées, il donne un total inférieur à la réalité
Graphique avec les données réelles
Au fond, c’est peut-être même une bonne chose. Les doublons représentaient 20 %, et beaucoup de problèmes pouvaient être résolus avec une simple bonne recherche
En revanche, le déplacement vers des endroits comme Discord est mauvais. Le savoir devient privatisé et n’est plus indexable par la recherche
Malgré tout, les données de SO restent entièrement ouvertes, donc même si l’entreprise disparaît, elles pourront être restaurées
J’ai été très actif sur SO à ses débuts, entre 2009 et 2010, mais je suis parti à cause de l’ingérence excessive des gestionnaires de communauté
Il existait ce phénomène où des gens incapables de contribuer utilisaient les règles comme une arme pour exercer de l’influence
Cela se répète dans toutes les communautés techniques populaires. On le voit aussi un peu sur HN
SO était devenu un environnement hostile où il était difficile ne serait-ce que de publier une question
J’avais 6k de réputation et plusieurs badges d’or, mais il arrivait souvent que des questions légitimes soient bloquées
Beaucoup de questions étaient fermées à tort comme doublons, et j’ai fini par me dire : « autant les laisser mourir »
Sur SO, la culture privilégiait la « normalisation des données » plutôt que l’aide concrète
Au final, c’est ce choc culturel qui m’a poussé à partir