1 points par GN⁺ 2023-10-21 | 1 commentaires | Partager sur WhatsApp
  • Un article sur l’exploration des articles les moins consultés de Wikipédia
  • L’auteur analyse la distribution des consultations à partir d’un échantillon aléatoire d’environ 32000 articles de Wikipédia, en utilisant les données de pages vues de 2021
  • L’article médian enregistre environ 1000 consultations par an, tandis que la moyenne se situe autour de 13000
  • Dans l’échantillon, les articles les moins consultés sont majoritairement des pages d’homonymie, c’est-à-dire des aides à la navigation renvoyant vers des articles portant des noms similaires
  • En excluant les pages d’homonymie, les articles les moins consultés portent surtout sur des espèces obscures ou des lieux géographiques peu connus
  • L’auteur émet l’hypothèse que le bouton « article au hasard » de Wikipédia pourrait représenter la majeure partie des pages vues des articles les moins populaires
  • Le bouton « article au hasard » attribue à chaque article un nombre aléatoire compris entre 0 et 1, et la probabilité qu’un article soit sélectionné est égale à l’écart entre le nombre qui lui est attribué et le nombre immédiatement inférieur
  • L’auteur constate que les articles les moins consultés ont tendance à présenter un écart très faible entre le nombre qui leur est attribué et le nombre immédiatement inférieur, ce qui suggère qu’ils ont moins de chances d’être sélectionnés par le bouton « article au hasard »
  • En 2021, les articles les moins consultés étaient deux articles sur des espèces de papillons, avec 3 pages vues chacun
  • L’auteur conclut que les articles les moins consultés de Wikipédia ne portent pas sur des sujets populaires, mais sur des cas où l’écart entre le nombre attribué et le nombre immédiatement inférieur est extrêmement faible
  • L’auteur souligne aussi que les règles et pratiques de Wikipédia en matière de notoriété et de suppression ont entraîné une rareté des articles sur des sujets obscurs qui pourraient être utilisés à des fins de promotion ou de conflit d’intérêts
  • L’auteur suggère enfin que l’existence de très petits articles extrêmement obscurs n’est pas nuisible et peut au contraire servir de base à de futurs développements

1 commentaires

 
GN⁺ 2023-10-21
Commentaires sur Hacker News
  • Un article qui met en avant les discussions sur les critères de suppression des articles sur Wikipédia, en soulignant que la notoriété dérivée de la nature et de la qualité des sources citées est la raison de suppression la plus fréquente
  • Mise en avant des changements apportés aux règles de notoriété de Wikipédia, en soulignant que cela a entraîné la suppression de nombreux articles sur des footballeuses internationales en raison du manque de couverture par les médias grand public
  • Mention de l’utilité des Navboxes sur Wikipédia, qui offrent une vue d’ensemble sur des sujets complexes et aident à comprendre comment les éléments s’articulent dans des hiérarchies complexes
  • Critique de la manière de choisir une page aléatoire sur Wikipédia, avec l’idée que cela pourrait introduire un biais permanent dans la randomisation
  • Éloge de l’immense étendue des informations disponibles sur Wikipédia, des espèces discrètes aux petits villages, ce qui aurait été impossible sans Internet
  • Suggestion humoristique selon laquelle il n’existe pas d’article inintéressant sur Wikipédia, puisque même le plus inintéressant devient intéressant à cause de cet état
  • Mention d’une série YouTube sur les gares les moins fréquentées de Network Rail au Royaume-Uni, comparée à l’article Wikipédia le moins consulté
  • Remarque selon laquelle les administrateurs de Wikipédia suppriment souvent les articles jugés sans importance, ce qui fait que l’article le moins consulté change souvent
  • Observation selon laquelle l’un des articles les moins consultés a été vandalisé peu après sa publication
  • Mise en avant d’une controverse sur l’envergure de l’espèce de papillon Scrobipalpula crustaria, comme exemple d’avis divergents sur un sujet paraissant normalement insignifiant
  • Enfin, remarque humoristique selon laquelle publier le nom de l’article Wikipédia le moins consulté ferait augmenter son nombre de vues, annulant ainsi l’objectif de la recherche