3 points par GN⁺ 2026-01-22 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • La part des posts Show HN a fortement augmenté ces derniers temps, avec une hausse particulièrement marquée depuis l’arrivée des LLM (grands modèles de langage)
  • Entre 2012 et 2022, cette part restait autour de 2 à 3 %, mais elle a atteint plus de 12 % en décembre 2025
  • En revanche, le score moyen est en baisse : en décembre 2025, le score moyen des Show HN est de 9,04, soit 10 points de moins que la moyenne globale (19,53)
  • L’auteur dit ne pas être certain d’une éventuelle baisse de qualité des posts générés par des LLM, et évoque seulement une possible fatigue des utilisateurs
  • L’analyse s’appuie sur les données publiques de Hacker News dans BigQuery, et le code Python ainsi que les fichiers CSV sont publiés sur GitHub

Analyse de l’évolution de la part et des scores des Show HN

  • De 2012 à 2022, la part des posts Show HN est restée stable autour de 2 à 3 %

    • Ensuite, l’arrivée des LLM capables d’écrire du code a fait monter cette proportion
    • Claude Code et Cursor 1.0 ont accéléré cette tendance
    • En décembre 2025, plus de 12 % de l’ensemble des posts étaient des Show HN
    • L’auteur indique explicitement qu’il existe une corrélation entre la hausse des Show HN et la diffusion des LLM
  • Les scores des Show HN suivent la tendance inverse, avec une baisse

    • Jusqu’en 2023-2024, ils se maintenaient à un niveau similaire à celui de l’ensemble des posts, autour de 15 à 18 points
    • En décembre 2025, la moyenne est de 9,04, soit environ 10 points de moins que la moyenne globale de 19,53
    • L’auteur précise : « Je ne peux pas affirmer avec certitude que les Show HN générés par des LLM sont de moins bonne qualité »
    • Il ajoute que « les utilisateurs ressentent peut-être une fatigue due au trop grand nombre de Show HN »
    • Il suppose aussi que la hausse du score moyen en 2022 pourrait être liée à « l’arrivée de nouveaux utilisateurs »

Méthode de collecte et d’analyse des données

  • L’analyse a été réalisée à partir du jeu de données public Hacker News de BigQuery

    • Une requête SQL a servi à extraire les champs time, title, type, score et id
    • Comme le champ type ne contient pas d’attribut show_hn, le filtrage a été fait en convertissant le titre en minuscules puis en vérifiant s’il commence par show_hn:
    • Les données représentent environ 400 Mo, et le CSV d’origine n’est pas inclus sur GitHub
    • Après exécution de la requête, les données ont été exportées vers Google Drive puis téléchargées
  • Le code d’analyse et les fichiers CSV sont disponibles dans le dépôt GitHub
    https://github.com/plastic041/hackernews

Suite prévue et limites

  • L’auteur voulait analyser plus en détail la part des posts Show HN générés par des LLM,
    mais comme l’usage d’un LLM n’est pas indiqué dans le corps des posts, il est impossible de les identifier
  • L’auteur prévoit de mettre à jour l’article tous les quelques mois en actualisant les données
  • Les données de 2026 ne couvrent encore que 13 jours et les scores ne sont pas stabilisés, elles sont donc exclues de l’analyse

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.