6 points par GN⁺ 2026-03-22 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Internet Archive, qui préserve le Web et les journaux depuis le milieu des années 1990, conserve plus de 1 000 milliards de pages Web via la Wayback Machine
  • Récemment, de grands médias comme The New York Times et The Guardian ont commencé à bloquer le crawl de l’archive en raison d’inquiétudes liées au scraping par l’IA
  • Cette mesure ne constitue pas seulement une limitation technique : elle provoque une rupture dans les archives historiques du Web, avec le risque de faire disparaître le seul enregistrement permettant de vérifier les changements apportés aux articles avant et après leur modification ou leur suppression
  • Indépendamment des litiges juridiques sur l’entraînement de l’IA, il est souligné que bloquer une institution de conservation à but non lucratif nuit à l’intérêt public
  • La recherche et l’archivage du Web sont déjà des domaines dont la légalité au titre du fair use est établie ; les bloquer ferait perdre aux chercheurs de demain l’histoire du Web

Bloquer Internet Archive n’arrêtera pas l’IA, mais effacera l’historique du Web

  • Internet Archive est la plus grande bibliothèque numérique au monde. Elle préserve le Web et les journaux depuis le milieu des années 1990 et stocke plus de 1 000 milliards de pages Web via la Wayback Machine
  • Ces derniers mois, The New York Times a commencé à bloquer le crawl de l’archive en invoquant des craintes liées au scraping de contenus par l’IA, et d’autres médias comme The Guardian semblent suivre le même chemin
  • Ce blocage n’est pas une simple restriction technique : il entraîne une rupture du record historique
    • Internet Archive constitue souvent le seul enregistrement permettant de vérifier les changements d’un article avant et après sa modification ou sa suppression
    • Si les médias bloquent l’accès, des décennies d’archives du Web risquent de disparaître
  • Alors que des litiges juridiques sur l’entraînement de l’IA sont en cours, il est indiqué que bloquer une institution de conservation à but non lucratif est une mauvaise réponse
    • Internet Archive ne développe pas de systèmes d’IA commerciaux et remplit une mission d’intérêt public de préservation historique
    • En cherchant à contrôler l’accès de l’IA, on risque aussi de porter atteinte à la fonction de conservation des bibliothèques

Légalité de l’archivage et de la recherche

  • Le fait de rendre un contenu consultable relève du fair use et est reconnu juridiquement depuis longtemps
    • Les tribunaux ont estimé qu’il était inévitable de reproduire les œuvres originales pour construire des index de recherche
    • Dans le cas où Google a copié des livres entiers pour créer une base de données de recherche, cela a également été reconnu comme ayant une transformative purpose
  • Internet Archive fonctionne lui aussi selon ce même principe
    • Comme une bibliothèque physique conserve les journaux, l’archive préserve l’historique du Web
    • Chercheurs et journalistes l’utilisent chaque jour ; Wikipédia à lui seul relie 2,6 millions d’articles d’actualité dans 249 langues à l’archive
    • D’innombrables blogueurs, chercheurs et journalistes s’y fient comme à une source stable et fiable
  • Les principes juridiques qui protègent les moteurs de recherche devraient aussi s’appliquer aux archives et aux bibliothèques

    • Même si les tribunaux devaient limiter l’entraînement de l’IA, la légalité de la recherche et de l’archivage du Web est déjà établie

Crise de la préservation du record historique

  • Internet Archive maintient l’historique du Web depuis environ 30 ans
  • Si les grands médias commencent à le bloquer, il est très probable que les chercheurs de demain perdent une masse considérable d’archives
  • Les débats juridiques liés à l’entraînement de l’IA doivent être tranchés devant les tribunaux, mais il est averti que sacrifier les archives publiques serait une erreur grave et irréversible

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.