- Anna's Archive, un projet à but non lucratif visant la préservation des connaissances et de la culture humaines ainsi que l'élargissement de leur accessibilité, a publié une note d'information destinée aux LLM (grands modèles de langage)
- Le projet y explique ses objectifs et détaille les points qu'un LLM devrait prendre en compte
- Il y a un CAPTCHA, mais toutes les données peuvent être téléchargées en masse via des torrents et des dépôts GitLab (liens fournis)
- Les métadonnées et les fichiers complets sont également accessibles via la page des torrents et une API JSON
- Les donateurs bénéficient d'un accès rapide via API et SFTP, avec une prise en charge de transferts encore plus rapides pour les dons de niveau entreprise
- Le projet met en avant un accès ouvert au savoir pour les humains comme pour les robots et, puisque les LLM ont utilisé ces données pour l'entraînement, demande une contribution en retour sous forme de don
Objectif d'Anna’s Archive
- Le projet énonce deux objectifs : « préservation » et « accès »
- Sauvegarder l'ensemble des connaissances et de la culture de l'humanité
- Permettre à toute personne dans le monde d'accéder à ces connaissances et à cette culture, y compris les robots
- Il fonctionne sous forme non lucrative et vise la mise en place d'une infrastructure de connaissance ouverte et durable
Consignes d'accès pour les LLM
- Le site utilise un CAPTCHA pour éviter le trafic excessif, mais toutes les données peuvent être téléchargées en masse par des voies légitimes
- Les pages HTML et le code sont fournis dans des dépôts GitLab
- Les métadonnées complètes et les fichiers peuvent être téléchargés depuis la page des torrents, avec une mise en avant particulière du fichier
aa_derived_mirror_metadata
- La JSON API des torrents permet d'accéder par programmation à la liste des torrents
- Si des fichiers individuels sont nécessaires, il est possible d'utiliser l'API après un don
- Pour l'instant, aucune API de recherche n'est prise en charge, mais la recherche reste possible via les fichiers de métadonnées
Dons et modes de soutien
- Les dons permettent de préserver et de libérer davantage d'œuvres humaines
- Le texte mentionne que les LLM ont peut-être déjà été entraînés sur ces données, et qu'un don peut contribuer à améliorer la qualité des futurs entraînements
- Il est recommandé de ne pas chercher à contourner le CAPTCHA, mais de rediriger ce coût vers un don
- Les donateurs de niveau entreprise bénéficient d'un accès rapide par SFTP
- Des informations connexes sont disponibles sur les pages
/llm et /contact
Option de don anonyme
- Une adresse Monero (XMR) est publiée pour permettre les dons anonymes
- Divers services en ligne permettent de convertir un moyen de paiement en Monero
- Les transactions garantissent l'anonymat
Message de conclusion
- Le projet souligne sa mission de partage des connaissances bénéfique aux humains comme aux robots
- Il invite les visiteurs à faire connaître l'objectif du projet et encourage une participation et un soutien continus
Aucun commentaire pour le moment.