- Guide pour modifier le contenu textuel d’un PDF sans outil commercial comme Adobe Acrobat
- Guide principal pour les utilisateurs Mac : mentionne des outils également utilisables sur la plupart des distributions Linux
- Stockage compressé des données textuelles dans un PDF : décompression avec l’outil en ligne de commande
qpdf
- Vérification des données textuelles après décompression : consultation dans un éditeur de texte avec leur encodage et leur association à une police spécifique
- Complexité de l’encodage du texte dans un PDF : nombreux encodages possibles, y compris des encodages personnalisés intégrés au fichier lui-même
- Extraction des informations d’encodage : utilisation de l’outil en ligne de commande
pdffonts
- Exemple montrant comment identifier la police liée à un encodage intégré et trouver la table d’encodage intégrée de cette police
- Table d’encodage : associe des points d’encodage personnalisés à des points Unicode
- Conversion de la table avec Python : transformation de la table en dictionnaire et écriture de fonctions d’encodage et de décodage
- Remplacement du texte d’origine à l’aide de ces fonctions : permet de remplacer le texte d’origine par un texte de remplacement encodé avec l’encodage personnalisé
1 commentaires
Avis Hacker News
mutoolpeuvent être utilisés pour convertir un PDF en une version sans données compressées, ce qui le rend plus facile à comprendre et à modifier.qpdfetRUPSpeuvent être utilisés pour analyser et modifier la structure d’un PDF.