1 points par GN⁺ 2025-01-19 | 1 commentaires | Partager sur WhatsApp

SMART NEWS

Pouvez-vous lire l’écriture cursive ? Les Archives nationales ont besoin de votre aide

  • Les Archives nationales regorgent de documents historiques rédigés en écriture manuscrite de plus de 200 ans. Ces documents sont difficiles à lire, en particulier pour les Américains qui n’ont pas appris la cursive à l’école.
  • Le programme Citizen Archivist vise à aider les bénévoles à transcrire et organiser des archives manuscrites afin de rendre les documents numériques plus accessibles.
  • Chaque année, des dizaines de millions d’archives sont numérisées, et l’intelligence artificielle ainsi que la reconnaissance optique de caractères sont utilisées pour extraire le texte des documents. Cependant, ces méthodes ne sont pas toujours exactes.
  • Les bénévoles transcrivent des pages numérisées pour aider les chercheurs, les généalogistes et les passionnés d’histoire à trouver et lire plus facilement des documents historiques.
  • Tout le monde peut participer gratuitement en s’inscrivant en ligne, sans procédure de candidature : il suffit de choisir des archives et de lire les consignes.
  • Si vous n’êtes pas sûr de pouvoir déchiffrer l’écriture cursive, vous pouvez aussi ajouter des tags à des documents déjà transcrits. Le travail de tagging améliore la recherchabilité des archives.

Bénévoles et missions

  • Plus de 5000 bénévoles participent déjà au programme Citizen Archivist et contribuent activement à des groupes de documents, appelés « missions », qui nécessitent des transcriptions et du tagging.
  • Par exemple, les missions en cours comprennent actuellement des dossiers de pension de la guerre d’indépendance américaine ainsi que des contrats de travail de 1866 à 1870.
  • La mission sur la guerre d’indépendance a été lancée en juin 2023 en collaboration avec le National Park Service, et comprend des dossiers liés à plus de 80000 anciens combattants et à leurs veuves.
  • Les bénévoles peuvent consacrer autant de temps qu’ils le souhaitent à la transcription et au tagging, et certains participants sont engagés dans le programme depuis des années.

Le retour de l’enseignement de l’écriture cursive

  • L’enseignement de l’écriture cursive était autrefois la norme, mais aujourd’hui, éducateurs et législateurs restent divisés sur son importance.
  • Pourtant, alors même que les appareils comme les ordinateurs portables et les tablettes se sont généralisés, l’écriture cursive suscite de nouveau de l’intérêt. Plus de 20 États imposent son enseignement à l’école.
  • En Californie, une loi rendant l’enseignement de la cursive obligatoire est entrée en vigueur en janvier 2024.
  • Le Kentucky a également adopté une loi imposant l’enseignement de la cursive. Des recherches indiquent que la capacité à lire la cursive et la fluidité dans cette lecture sont liées à la capacité à l’écrire.

1 commentaires

 
GN⁺ 2025-01-19
Avis sur Hacker News
  • Certains estiment que le projet est très intéressant, mais qu’il est difficile d’y participer

    • L’article ne fournit pas de lien direct vers la mission thématique
    • L’inscription est relativement simple, bien organisée, et exige deux formes de 2FA
    • Une fois inscrit, le processus pour revenir à la page principale et trouver la mission est un peu compliqué
    • Le fait que la session ne reste pas active crée une gêne
    • Certains jugent inapproprié que des bénévoles apportent leur aide via une interface inefficace
  • Discussion sur l’utilisation des LLMs

    • L’article précise qu’il utilise des LLMs et l’OCR, mais que les résultats ne sont pas toujours exacts
    • Les premiers documents sont probablement des documents faciles destinés à encourager les gens à se lancer
  • Expérience de transcription d’une lettre de 1814 écrite par une femme

    • Transcription d’une lettre adressée à James Monroe pour demander un passeport afin de se rendre en Écosse
    • Une fois habitué à l’écriture, l’immersion devient très forte
    • Les histoires lues pendant la transcription restent longtemps en mémoire
  • Discussion sur la confiance envers les OCR/LLMs et sur les limites de la technologie

    • La technologie peut simplifier les tâches répétitives, mais les résultats doivent être vérifiés par des humains
    • GPT-4o montre de meilleures performances sur un exemple précis
  • Le plaisir des projets de transcription

    • Certains estiment que transcrire des lettres et journaux archivés est très gratifiant
    • On a l’impression que la distance temporelle avec l’auteur disparaît presque
  • La difficulté de déchiffrer l’écriture cursive

    • Partage d’expériences personnelles et explication des raisons pour lesquelles l’écriture cursive est difficile à lire
    • L’écriture cursive est peu utilisée aujourd’hui, mais elle est encore enseignée dans les écoles Montessori
  • Proposition selon laquelle les entreprises d’IA pourraient contribuer aux projets de transcription d’intérêt public

    • Elles pourraient utiliser des financements de VC pour obtenir des données d’entraînement de haute qualité
  • Demande de déchiffrement de texte adressée à un archéologue spécialisé dans la lecture des écritures manuscrites

    • Présentation d’un exemple de déchiffrement du manifeste de James Lambert