Tentative d’ouverture du fichier original de la proposition WWW
- Le site du W3C contient la proposition originale du WWW rédigée par Tim Berners-Lee.
- Le fichier source de la proposition est un fichier Word pour Macintosh 4.0, vraisemblablement créé en 1990.
- Le document original pèse 68 608 octets et, après vérification du type de fichier sur Mac, il apparaît comme un fichier Microsoft Word for Macintosh 4.0.
Tentatives d’ouverture avec différents logiciels
- Microsoft Word : le fichier original a été téléversé sur OneDrive puis ouvert dans Microsoft Word avec l’extension
.doc.
- Apple Pages : ne comprend pas les anciens fichiers Microsoft Word for Macintosh.
- Apache OpenOffice : peut ouvrir le fichier, mais la mise en forme disparaît et les diagrammes sont absents.
- LibreOffice : ouvre le fichier et affiche aussi clairement les diagrammes, mais il subsiste des problèmes de marges et d’autres écarts de formatage.
Comparaison entre le PDF du CERN et le PDF généré par LibreOffice
- Le PDF fourni par le CERN a été généré en 1998 et compte 20 pages.
- La version importée dans LibreOffice en compte 24.
- En comparant les deux PDF, on constate des différences de marges, de taille de police, d’en-têtes et de pieds de page, ainsi que de pagination.
Vérification du document original via émulation
- En émulant un Macintosh des années 1990, l’auteur a pu exécuter le véritable Word for Macintosh 4.0 et voir à quoi ressemblait le document original.
- Le document original et le PDF du CERN diffèrent sensiblement, et le document original apparaît sur 22 pages au format A4.
Conclusion
- Convertir le document original avec des logiciels modernes constitue à la fois une victoire pour les logiciels open source et une démonstration des difficultés de la préservation documentaire.
- Une version
.odt a été téléversée sur GitHub afin de préserver le document.
- Il est quelque peu décevant qu’un document vieux de 34 ans reste difficile à ouvrir et que, même une fois ouvert, il ne soit pas exactement identique à l’original.
L’avis de GN⁺
- Ce billet de blog souligne l’importance de la préservation numérique et de l’accessibilité du document original de la proposition WWW.
- Il montre à quel point les logiciels open source jouent un rôle essentiel dans le traitement des anciens formats de documents.
- Cela aide à comprendre les difficultés de la préservation documentaire et à prendre conscience de l’importance de la compatibilité et de l’accessibilité à long terme à mesure que la technologie évolue.
1 commentaires
Avis Hacker News
Partage d’un document converti dans un format Word moderne
Vérification des polices et de la mise en page
Utilité de la commande
filefileest très utile pour lever les doutes sur un fichier et fournir des informations utiles.Excellente prise en charge des anciens formats de fichiers de documents par LibreOffice
Rétrocompatibilité de Microsoft Word
Les capacités étonnantes de LibreOffice
Impression de documents dans un émulateur
Déception vis-à-vis de la compatibilité documentaire de Microsoft Word
Problèmes potentiels des sauvegardes à conservation illimitée
Utilisation d’anciens Mac et de Word