9 points par ffdd270 2020-09-09 | 4 commentaires | Partager sur WhatsApp

Pour résumer l’article, voici l’essentiel.

Lorsqu’on ajoute un lien à titre de référence, on ne peut pas être certain, par nature, que le contenu consulté à l’époque sera identique à celui qu’on verra quelques années plus tard. Les problèmes suivants sont particulièrement fréquents.

  • 404 / Not Found - le cas le plus courant

  • Un contenu modifié, édité ou entièrement remplacé.

  • Un contenu devenu plus populaire et désormais protégé, au point qu’il faille créer un compte pour lire l’article en entier.

L’auteur explique donc qu’un lien vers une archive (WayBackMachine) est plus fiable qu’un lien vers un contenu web dynamique et instable. Il prend comme exemple un contenu qui était librement consultable jusqu’au 14 février 2019, mais qui est aujourd’hui inaccessible à moins de « payer pour le journalisme », afin de souligner pourquoi les archives sont importantes.

Il affirme que c’est encore plus nécessaire à notre époque. Nous vivons une période instable et, notamment à cause de la pandémie de Covid et de marchés financiers sous tension, des sites web disparaissent, affichent davantage de publicités ou demandent aux utilisateurs une contrepartie pour lire un article.

Selon l’article, pour éviter que ces problèmes ne dégradent la qualité du contenu, il est plus sûr de faire un lien vers une copie statique, solide et immuable.

4 commentaires

 
lunamoth 2020-09-09

Je pense qu’il reste préférable de lier l’article original, par respect pour son auteur.

Cela dit, j’archive sur archive.is les contenus qui risquent de disparaître.

 
xguru 2020-09-09

À ce sujet, un responsable de l’équipe de Wayback Machine a déclaré ce qui suit.

https://news.ycombinator.com/item?id=24411324

Nous suggérons/encourageons les gens à créer des liens vers les URL d’origine mais AUSSI (plutôt qu’à la place) à fournir des URL Wayback Machine afin que, si/quand les URL d’origine deviennent invalides (link rot), l’URL archivée soit disponible, ou pour donner aux gens un moyen de comparer dans le temps le contenu associé à une URL donnée (content drift)

Dans la mesure du possible, il vaut mieux ne pas « remplacer le lien par Wayback Machine », mais « fournir ensemble le lien d’origine et le lien Wayback Machine » afin que, au cas où l’original disparaisse, ou pour pouvoir consulter également les éventuelles modifications, ce soit possible.

 
ffdd270 2020-09-09

Il semble qu’il y ait quelques questions à prendre en compte. Dans ce cas, aucun trafic n’irait au site d’origine, et certains estiment qu’il faut aussi faire preuve de respect à cet égard. Bien sûr, s’il est impossible de retrouver un site parce qu’il a été supprimé ou que son arborescence a changé, on n’y peut rien. Mais lorsque le billet original est toujours disponible normalement, mettre dès le départ un lien vers une archive ne me paraît pas très respectueux envers son auteur. D’un autre côté, cela rappelle une fois de plus qu’il est en pratique presque impossible qu’un texte soit vraiment oublié sur Internet. C’est inquiétant.

Moi, une fois que je l’ai lu, je le range soigneusement dans Pocket. Cela dit, c’est dommage qu’il y ait quelques sites que Pocket n’arrive pas bien à clipper.

 
heycalmdown 2020-09-09

J’ai lu le résumé de l’article en me disant « ah, d’accord ! », puis en lisant les commentaires, je me suis encore dit « ah… d’accord ».

Ce serait bien de mettre deux liens et que, lorsque l’accès à l’original est impossible, cela bascule sur un lien de secours.