ArchiveTeam a terminé l’archivage de tous les liens raccourcis goo.gl
(tracker.archiveteam.org)- ArchiveTeam a archivé avec succès tous les liens raccourcis goo.gl
- N’importe qui peut participer au projet d’archivage via le programme d’archivage virtuel ArchiveTeam Warrior
- Ce Warrior peut être exécuté sous Windows, OS X et Linux sans risque particulier
- Les utilisateurs peuvent sélectionner un projet et participer à l’activité grâce à une configuration simple
- Il offre une méthode simple et intuitive pour contribuer aux activités d’archivage, même sans compétences techniques particulières
Présentation d’ArchiveTeam Warrior
- ArchiveTeam Warrior est une appliance virtuelle d’archivage que tout le monde peut utiliser facilement
- En lançant Warrior, les utilisateurs peuvent participer au téléchargement de sites web, etc. puis à leur envoi vers les archives d’ArchiveTeam
- Warrior ne présente pas de danger pour l’environnement informatique réel et n’utilise que la bande passante Internet et un peu d’espace disque
- Il prend en charge Windows, OS X et Linux, et nécessite un logiciel de machine virtuelle comme VirtualBox ou VMware
Utilisation avec VirtualBox
- Télécharger l’appliance Warrior (357 Mo)
- Dans VirtualBox, cliquer sur le menu File > Import Appliance pour charger le fichier téléchargé
- Au démarrage de la machine virtuelle, les dernières mises à jour sont récupérées automatiquement, puis une demande d’utilisation du navigateur web apparaît
Processus après le lancement de Warrior
- Accéder à la page Settings et la consulter
- Choisir un nom d’utilisateur afin d’afficher sa progression dans le leaderboard
- Dans l’onglet All projects, sélectionner le projet souhaité pour participer, ou choisir ArchiveTeam’s Choice afin de rejoindre le projet le plus urgent
Les avantages de la participation
- Sans compétences particulières ni procédure complexe, tout le monde peut contribuer facilement aux projets d’archivage
- Les résultats des activités d’archivage de l’utilisateur sont affichés dans le leaderboard, ce qui favorise la motivation et la collaboration
1 commentaires
Commentaires sur Hacker News
À chaque fois qu’ArchiveTeam mène ce genre de projet, je suis vraiment impressionné. Il y a quelques années, quand la plateforme vidéo où je travaillais allait annoncer sa fermeture, j’ai été mis en relation avec quelqu’un d’ArchiveTeam et j’ai appris qu’il s’intéressait à la préservation des données. Je lui ai donné quelques conseils (des informations sur des endpoints serveur susceptibles de poser des difficultés pour l’archivage) et je lui ai prêté temporairement quelques-unes de mes instances EC2. Comme les serveurs m’appartenaient, je pouvais voir ce qui se passait : en deux minutes, les instances étaient entièrement prêtes, ont commencé à archiver rapidement les vidéos, et chacune téléchargeait efficacement des vidéos différentes sans doublons. ArchiveTeam a toujours une excellente mission, mais l’efficacité de son exécution est vraiment impressionnante.
Le titre n’est pas exact. En réalité, c’est Archiveteam.org, pas Archive.org. The Internet Archive fournit l’espace de stockage, mais le véritable travail d’archivage est effectué par les membres d’Archiveteam.
Je voulais partager des éléments liés : « Rejoindre la guerre contre la pourriture des liens (Link Rot) » (lien), ainsi que plusieurs fils de discussion HN sur les changements de politique de Google concernant goo.gl (sélection d’articles liés de 2018 à 2025, ici, ici, ici, ici, ici, ici). Il y a des discussions variées, j’espère que cela sera utile.
Je partage la dernière mise à jour de Google : lien vers la mise à jour du blog Google
Est-ce que quelqu’un archive l’intégralité de reddit ou de twitter ? Je suis curieux, même si leurs Terms ont changé de façon à ne plus le permettre.
Je ne comprends pas bien la page. Il y a une liste de jeux de données (j’imagine ?) et la taille semble monter jusqu’à 91 TiB. Je n’ai pas l’impression qu’il faille 91 TiB juste pour une liste de liens raccourcis Google et de leurs URL cibles. Quelqu’un connaît-il le principe ?
Je suis heureux d’avoir pu contribuer, même un peu, à cet archivage.
docker containerpendant une journée puis l’oublier.Je me demande combien de liens pointent vers des vidéos YouTube privées, des documents Google, etc.
Je me demande si « all » désigne vraiment toutes les URL publiquement accessibles, ou si cela signifie qu’ils ont essayé de manière itérative tout l’espace de noms des URL.