Anna's Archive : dernières nouvelles de l'équipe
(annas-archive.org)- Face à la hausse des attaques contre la mission récente, un renforcement de la sécurité de l'infrastructure et des opérations est en cours
- Depuis son lancement en 2022, le projet préserve et partage en toute sécurité des dizaines de millions de livres, articles scientifiques, magazines, journaux et autres documents
- Grâce à un scraping à grande échelle, une vaste quantité de métadonnées a été collectée depuis WorldCat, Google Books et d'autres sources afin d'identifier les documents encore non collectés
- Des partenariats avec LibGen, Z-Library et d'autres ont permis d'obtenir des dizaines de millions de documents supplémentaires, même si la disparition de certains partenaires est regrettée
- Une relation prudente est maintenue avec de nouveaux sites comme WeLib, et leur usage est déconseillé en raison d'une contribution insuffisante à la communauté
Situation récente et réponse de l'équipe
- Les attaques visant la mission d'Anna's Archive se sont multipliées récemment
- En réponse, des mesures de renforcement de la sécurité de l'infrastructure et des opérations sont en cours
- Préserver en toute sécurité le patrimoine de la connaissance de l'humanité reste une activité qui mérite d'être poursuivie
Libération des documents et activité d'archivage
- Depuis son lancement en 2022, le projet a réuni des dizaines de millions de livres, d'articles scientifiques, de magazines, de journaux et d'autres contenus
- Ces documents sont protégés contre diverses menaces telles que les catastrophes naturelles, la guerre ou les coupes budgétaires
- Grâce aux efforts de toutes celles et ceux qui ont contribué à diffuser ces documents via torrent, le risque de perte a fortement diminué
Scraping à grande échelle et collecte de métadonnées
- Anna's Archive organise de manière systématique un scraping à grande échelle depuis IA Controlled Digital Lending, HathiTrust, DuXiu et d'autres sources
- Le projet a réussi à obtenir des fichiers correspondant à des dizaines de millions de documents
- Une vaste collection de métadonnées de livres a été constituée à partir de WorldCat, Google Books et d'autres sources
- Ces métadonnées servent à identifier les livres qui ne figurent pas encore dans la collection et à alimenter une stratégie de collecte prioritaire pour les documents rares
Communauté, coopération et nouveaux développements
- En collaborant avec des partenaires comme les forks de LibGen, STC/Nexus, Z-Library et d'autres, le projet a obtenu des dizaines de millions de fichiers supplémentaires
- Ces partenaires apportent une aide importante à la mission, notamment en miroirant les fichiers
- Toutefois, la disparition de l'un des forks de LibGen est perçue comme regrettable
Nouveaux projets et points de vigilance
- Un nouveau projet appelé WeLib est apparu récemment
- Il miroir la majeure partie des collections d'archives et utilise un fork de la codebase d'Anna’s Archive
- Certaines améliorations de l'interface utilisateur de WeLib ont été reprises et intégrées
- Cependant, aucun partage de nouvelles collections ni d'améliorations de la codebase n'a eu lieu, ce qui témoigne d'un engagement insuffisant envers l'écosystème
- En conséquence, la prudence est recommandée concernant l'utilisation de WeLib
- En outre, des centaines de téraoctets de nouvelles collections sont déjà préparés sur les serveurs et en attente de traitement
Appel au bénévolat et aux dons
-
Toute personne peut participer au projet via la page de bénévolat et de dons
-
Le projet fonctionne entièrement avec un budget réduit, donc la moindre aide a une grande valeur
-
L'équipe encourage à poursuivre les efforts continus pour protéger et libérer le patrimoine de la connaissance
-
Anna et toute l'équipe (voir la communauté Reddit)
Aucun commentaire pour le moment.