1 points par GN⁺ 2024-02-06 | 1 commentaires | Partager sur WhatsApp

Grand prix du Vesuvius Challenge 2023 : succès de la lecture du premier rouleau

  • Les papyrus d'Herculanum, ensevelis il y a 2 000 ans par une éruption volcanique, ont été découverts.
  • Ces rouleaux ont été carbonisés et ne peuvent pas être déroulés sans dommage sans chaleur.
  • Le 15 mars 2023, Nat Friedman, Daniel Gross et Brent Seales ont lancé le Vesuvius Challenge.
  • Des scans CT haute résolution ont été publiés, avec plus d'un million de dollars de récompenses à la clé.
  • Une communauté mondiale s'est attaquée au problème à l'aide de la computer vision et du machine learning.
  • En décembre 2023, bien que 95 % du rouleau restent encore à lire, il est devenu possible de déchiffrer une partie d'un rouleau pour la première fois en 2 000 ans.

Grand prix

  • De très nombreuses excellentes soumissions ont concouru pour le grand prix du Vesuvius Challenge.
  • Le jury a examiné les soumissions tout au long du mois de janvier.
  • L'équipe formée par Youssef Nader, Luke Farritor et Julian Schilliger a été désignée lauréate du grand prix.
  • Cette équipe a récupéré indépendamment le plus grand volume de texte.
  • Le code et les méthodes soumis ont été vérifiés et reproduits par l'équipe technique.
  • Récompense de 700 000 dollars.

Finalistes

  • Les finalistes ont chacun reçu 50 000 dollars.
  • Ils ont proposé de nouvelles approches sur les subtilités du marquage de l'encre et de l'échantillonnage.

Que dit le rouleau ?

  • Environ 5 % du premier rouleau ont pu être déroulés virtuellement et lus.
  • Ce rouleau n'est pas un doublon d'une œuvre existante et contient un texte antique.
  • Le texte traite du plaisir et comprend une discussion philosophique sur les joies de la nourriture et de la musique.

Quelle est la fiabilité des images ?

  • Plusieurs mesures ont été prises pour éviter les « hallucinations » des modèles de machine learning.
  • Reproduction technique, soumissions multiples sur une même zone, et utilisation de petites fenêtres d'entrée/sortie.

Comment déroule-t-on un rouleau ?

  • Le déroulage virtuel se compose de trois étapes : scan, segmentation et détection de l'encre.
  • Un scan 3D est généré à l'aide de la tomographie à rayons X du Diamond Light Source.
  • La segmentation consiste à identifier et déplier les couches de ces rouleaux complexes.
  • La détection de l'encre utilise des modèles de machine learning pour repérer les zones encrées dans les parties dépliées.

Qu'a-t-il fallu ?

  • Le Vesuvius Challenge espère résoudre le problème de la lecture des papyrus d'Herculanum et inspirer des projets similaires.
  • La définition d'un objectif clair, un point de départ solide, l'équilibre entre compétition et collaboration, le recrutement d'une équipe interne de segmentation et la maximisation de la surface explorée pour provoquer des percées ont été essentiels.

Et maintenant ? Annonce du grand prix Vesuvius Challenge 2024.

  • L'objectif pour 2024 est de passer de 5 % d'un rouleau à 90 % de quatre rouleaux lisibles.
  • Le grand prix 2024 sera attribué à la première équipe qui y parviendra.
  • L'automatisation du processus de segmentation est l'objectif principal.

Remerciements

  • Merci à toutes les personnes ayant contribué au projet, aux donateurs, à l'équipe organisatrice, aux partenaires, aux chercheurs, au personnel de soutien et aux lauréats du grand prix.

Avis de GN⁺ :

  • Ce projet constitue une avancée majeure, en combinant restauration numérique de documents antiques et machine learning pour offrir une nouvelle compréhension de l'histoire humaine.
  • Le Vesuvius Challenge peut être vu comme un exemple remarquable de recherche innovante au croisement de la technologie et des humanités.
  • Ces efforts pourraient potentiellement restaurer des savoirs culturels et philosophiques oubliés pendant des millénaires et offrir de nouveaux éclairages à la société contemporaine.

1 commentaires

 
GN⁺ 2024-02-06
Commentaires Hacker News
  • Résumé du premier commentaire :

    • Fascination pour la technologie de déroulage numérique des rouleaux, pour la méthode consistant à reconnaître les fissures du papier comme signal de l’encre, et pour le processus d’assemblage pièce par pièce du modèle permettant de les détecter.
    • Une certaine confusion face à l’utilisation de TimeSFormer. Il était connu comme outil pour la vidéo, et il y a de la curiosité sur la manière dont il a été appliqué aux images.
    • Une grande journée pour l’archéologie, avec de vifs applaudissements adressés aux jeunes esprits pour cet accomplissement.
  • Résumé du deuxième commentaire :

    • Étonnement devant l’aspect apparemment impossible du projet et l’intelligence des personnes qui y ont participé.
    • Au départ, il semblait qu’il faudrait 5 à 10 ans, mais il y a maintenant de la surprise et des félicitations pour ce qui a été accompli.
  • Résumé du troisième commentaire :

    • Le niveau atteint est si impressionnant qu’une technologie très avancée en devient presque indiscernable de la magie.
    • Interrogation sur le fait de savoir si les techniques de machine learning sont récentes ou existent depuis longtemps, et sur la manière dont ces algorithmes sont appliqués à de nouveaux problèmes à mesure qu’ils gagnent en popularité.
  • Résumé du quatrième commentaire :

    • L’une des choses les plus formidables lues cette année, et l’idée de pouvoir lire du texte sur un rouleau carbonisé vieux de 2 000 ans relève de la science-fiction.
  • Résumé du cinquième commentaire :

    • Le travail manuel nécessaire pour séparer les rouleaux scannés et le coût du scan de nouveaux rouleaux constituent les principaux goulets d’étranglement pour lire davantage de texte.
  • Résumé du sixième commentaire :

    • L’un des aspects fascinants de l’archéologie est la pratique consistant à laisser volontairement certains artefacts inexplorés pour les technologies du futur.
    • Les découvreurs d’origine avaient tenté de dérouler les rouleaux, mais ont compris que c’était impossible et ont laissé le reste intact.
  • Résumé du septième commentaire :

    • Le fait que le modèle d’origine ait été entraîné sur une carte graphique 1070 est un travail remarquable.
  • Résumé du huitième commentaire :

    • Grande excitation à l’idée que cette collection de rouleaux puisse contenir des récits perdus.
  • Résumé du neuvième commentaire :

    • Philodème écrivait dans une villa ensevelie par la lave du Vésuve, et 2 000 ans plus tard, nous utilisons une technologie de pointe pour reconstituer ses écrits.
    • Comme c’était quelqu’un qui réfléchissait, on aimerait pouvoir lui dire que nous sommes finalement capables de lire ce qu’il a écrit.
  • Résumé des liens associés :

    • Lien vers un article sur l’étudiant en informatique qui a découvert le premier mot dans les rouleaux d’Herculanum, ainsi qu’un lien de discussion sur le Vesuvius Challenge.