1 points par GN⁺ 2026-01-04 | 2 commentaires | Partager sur WhatsApp
  • Une page de requête de données qui visualise l’évolution du nombre mensuel de questions sur Stack Overflow
  • Après un démarrage à quelques milliers à environ 10a0000 questions par mois en 2008, au début du service, environ 150a0000 à 200a0000 questions ont été publiées entre 2014 et 2018, puis, à partir de 2019, le nombre mensuel de questions est passé d’un pic à une tendance baissière
  • Entre 2023 et 2025, l’ampleur de la baisse s’accentue encore, et en 2025, le nombre de questions mensuelles tombe à environ 10a0000
  • Cela représente une baisse de plus de 90 % par rapport à l’âge d’or

2 commentaires

 
kandk 2026-01-05

Je suis curieux de connaître l’avenir de StackOverflow.

 
GN⁺ 2026-01-04
Réactions sur Hacker News
  • J’avais déjà posté sur Stack Overflow une méthode pour calculer la distance minimale entre une ellipse et un point
    Lien vers ma réponse
    C’est un algorithme que j’ai conçu moi-même ; il tient en quelques lignes de code, mais il converge très rapidement. Je pense que c’est le plus beau code que j’aie écrit de ma vie
    À une époque, il y a même eu un article qui le citait, et j’ai entendu dire qu’il avait aussi été utilisé dans un plugin de collision pour Unity. Aujourd’hui, plus personne ne me contacte
    Je ne sais même plus où publier ce genre de chose maintenant. C’est un peu bancal pour en faire un article scientifique, et autrefois SO était justement un bon endroit pour publier ça, mais j’ai l’impression que ce dépôt centralisé a disparu

    • Tu peux en faire un article et le mettre sur arXiv, ou bien l’expliquer sur un blog
      Moi aussi, à l’époque, j’avais posté sur SO une astuce pour empêcher un EKF de devenir singulier, et un professeur m’a dit qu’il m’avait repéré grâce à ça. Ce genre de communauté est difficile à remplacer
    • Je recommande vraiment de lancer un blog. La combinaison Hugo + GitHub Pages est vraiment simple
      Même si tu écris peu, le monde gagne à être enrichi par ce genre de blogs personnels
    • Mais au fond, la vraie question n’est pas tant « où publier ? », c’est qu’on est désormais dans une époque où les questions techniques elles-mêmes ne sont plus posées publiquement
      Et du coup, on se demande où les techniciens pourront encore trouver des problèmes qui stimulent leur créativité
    • Cela dit, le soumettre officiellement à une revue reste aussi une option. Je pense que c’est mieux que de le laisser n’exister que de manière informelle
    • Moi aussi, j’étais extrêmement actif sur SO vers 2012. Encore aujourd’hui, il m’arrive de tomber via Google sur une de mes réponses bien classées, et de me dire avec surprise : « Tiens, c’est moi qui avais écrit ça »
  • Ce graphique m’a vraiment surpris. Je ne pensais pas que SO avait connu un déclin aussi brutal
    C’est encore plus rapide que Britannica, qui a arrêté son édition papier neuf ans après l’arrivée de Wikipédia
    Je ne pense pas que les problèmes de SO viennent de sa « modération brutale ». Fondamentalement, c’est surtout qu’il existe désormais d’autres canaux permettant d’obtenir des réponses plus vite
    À partir de 2016 environ, Reddit apparaissait souvent dans les résultats de recherche, et on pouvait aussi obtenir des réponses sur Discord
    Le coup de grâce a été les LLM. On peut désormais obtenir instantanément des réponses du niveau de SO
    Dans ce cas, sur quoi les LLM vont-ils s’entraîner à l’avenir ? Vont-ils continuer à recycler les données de SO de 2014 à 2020 ?

    • Si la documentation est bien organisée et fournie dans un format compatible avec les LLM, la plupart des questions peuvent être résolues par un LLM
      Par exemple, même si une documentation d’API ne couvre pas tous les scénarios détaillés, un LLM peut combiner plusieurs documents pour produire une réponse
    • À l’avenir, la plupart des réponses viendront probablement de conversations avec des LLM
      Cela dit, pour des écosystèmes spécialisés comme Salesforce ou Workday, les forums restent plus utiles
    • Le contenu de SO venait de l’expérience de terrain et des tâtonnements des développeurs
      À l’avenir, les LLM joueront le rôle de collecter et redistribuer ce type d’expérience à grande échelle
    • C’est dommage que SO n’ait pas réussi à construire lui-même un LLM de haute qualité
    • On voit apparaître un phénomène d’« internet mort » : les interactions humaines diminuent, les LLM apprennent à partir de ces données, puis les conversations humaines diminuent encore davantage
  • L’arrivée des LLM a mis en lumière les problèmes de SO
    Des questions étaient fermées injustement, des réponses anciennes n’étaient pas mises à jour, et la culture autoritaire des gros contributeurs était très forte
    J’ai le sentiment que les LLM sont bien meilleurs sur ces points

    • Moi aussi, j’avais déjà cessé de participer à SO avant même l’ère des LLM. La modération autoritaire était trop pesante
    • À chaque fois qu’on posait une question, il y avait beaucoup de remarques inutiles du type « il ne faut pas faire ça comme ça »
    • Je pense que GitHub Discussions a aussi contribué en partie au déclin de SO
      Depuis la sortie de la bêta publique (2020), je l’utilise de plus en plus
    • En réalité, la baisse du nombre de questions avait déjà commencé entre 2014 et 2016
    • Il y a aussi eu une période où Google ne mettait plus les réponses de SO en tête des résultats
  • Ces deux dernières semaines, j’ai galéré sur un problème de transformation Spark, et les réponses de Gemini et Claude étaient plausibles, mais toutes fausses
    J’ai fini par trouver la solution sur SO, ce qui m’a aussi permis d’arriver jusqu’au bon passage de la documentation Spark
    Les LLM sont aimables, mais on dirait un ami qui affirme avec assurance des choses fausses
    À l’inverse, SO est peu aimable, mais il a réellement résolu mon problème

    • L’avantage de SO, c’est sa structure de discussion. Plusieurs personnes échangent leurs points de vue, et la meilleure réponse remonte vers le haut
      Les LLM ne peuvent pas remplacer ce type de débat humain ni la profondeur de l’expérience
    • Sur SO, il y avait beaucoup d’excellentes réponses qui ne donnaient pas seulement une solution, mais expliquaient aussi le « pourquoi »
    • Mais au final, les LLM apprennent eux aussi à partir d’entrées humaines, et cette expérience s’intègre dans le modèle
      Avec le temps, ils deviendront progressivement plus précis
    • Bien sûr, SO non plus ne donnait pas toujours la bonne réponse. Sur les problèmes difficiles, il arrivait souvent qu’il n’y ait pas de réponse, ou qu’elle soit erronée
      Dans mon cas, les LLM montrent un taux de bonnes réponses plus élevé
    • Malgré tout, la culture du Q&R ne disparaîtra pas. Il existe des alternatives comme GitHub Discussions
  • En programmation, les LLM restent écrasants de rapidité et d’une réactivité immédiate
    Si on leur donne plus d’informations, ils corrigent aussitôt et itèrent jusqu’à comprendre complètement le problème
    Et en plus, personne n’est sarcastique

  • Les gens attribueront ce déclin à l’IA, mais en réalité, il s’agissait surtout de la toxicité de la communauté et de problèmes de direction du site
    Lien vers un commentaire en doublon

    • Les fils de discussion de Stack Exchange étaient vraiment acerbes.
      Mais à un certain moment, la plupart des questions avaient déjà trouvé une réponse, et Google menait directement à celle-ci
      Les LLM ne sont que « la dernière pièce » posée par-dessus
    • Plus que la toxicité, le vrai facteur, c’était la saturation. Les questions de base avaient déjà toutes reçu une réponse, et les nouvelles étaient fermées comme doublons
    • Avec le temps, les questions en doublon se sont multipliées, et comme elles ne figurent pas dans les statistiques, la baisse a pu paraître encore plus forte
      Changement de CEO en 2020 et création d’un conseil des modérateurs
    • En réalité, la baisse a commencé vers 2017, avec un bref rebond au début du Covid
  • Je suis d’accord pour dire que SO avait un côté toxique, mais malgré cela, cela reste une immense réussite du savoir ouvert sur Internet
    Son influence pour ouvrir la programmation au grand public reste énorme

    • Mais certains y voient « le résultat d’une trahison de la communauté au profit de l’argent »
  • Vu comme analyste de données, la baisse du nombre de questions est un phénomène naturel
    Les questions faciles ont déjà toutes été posées, et les nouvelles deviennent de plus en plus difficiles
    Comme ce graphique n’inclut pas les publications supprimées, il donne un total inférieur à la réalité
    Graphique avec les données réelles
    Au fond, c’est peut-être même une bonne chose. Les doublons représentaient 20 %, et beaucoup de problèmes pouvaient être résolus avec une simple bonne recherche
    En revanche, le déplacement vers des endroits comme Discord est mauvais. Le savoir devient privatisé et n’est plus indexable par la recherche
    Malgré tout, les données de SO restent entièrement ouvertes, donc même si l’entreprise disparaît, elles pourront être restaurées

  • J’ai été très actif sur SO à ses débuts, entre 2009 et 2010, mais je suis parti à cause de l’ingérence excessive des gestionnaires de communauté
    Il existait ce phénomène où des gens incapables de contribuer utilisaient les règles comme une arme pour exercer de l’influence
    Cela se répète dans toutes les communautés techniques populaires. On le voit aussi un peu sur HN

  • SO était devenu un environnement hostile où il était difficile ne serait-ce que de publier une question
    J’avais 6k de réputation et plusieurs badges d’or, mais il arrivait souvent que des questions légitimes soient bloquées

    • Moi aussi, j’avais environ 2k de réputation, mais il fallait 3k pour pouvoir voter à la réouverture d’une question
      Beaucoup de questions étaient fermées à tort comme doublons, et j’ai fini par me dire : « autant les laisser mourir »
    • Même pour répondre, il y avait trop de monde qui se ruait dessus, la concurrence était féroce, et le plaisir de contribuer avait disparu
    • J’avais 25k de réputation, mais j’ai fini par abandonner parce qu’à chaque fois que j’écrivais une réponse, la question était immédiatement fermée
      Sur SO, la culture privilégiait la « normalisation des données » plutôt que l’aide concrète
      Au final, c’est ce choc culturel qui m’a poussé à partir