- Un parseur de contenu qui supprime les éléments inutiles d’une page web — commentaires, barres latérales, en-têtes et pieds de page — pour extraire uniquement le contenu principal en HTML/Markdown
- Pour les vidéos YouTube, il peut aussi extraire les dialogues en les séparant par intervenant (à partir de la version 0.12.0)
- Développé pour Obsidian Web Clipper, mais utilisable dans divers environnements comme le navigateur ou Node.js
- Conçu comme une alternative à Mozilla Readability, avec un traitement plus flexible et une sortie plus cohérente
- Réduit au minimum la suppression d’éléments incertains
- Prend en charge une sortie normalisée pour les notes de bas de page, formules et blocs de code
- Détecte les éléments inutiles grâce à l’analyse des styles mobiles
- Extrait automatiquement davantage de métadonnées, y compris les métadonnées schema.org
- Prend en charge une interface CLI, permettant d’analyser directement du HTML ou des URL depuis le terminal
- Licence MIT
Aucun commentaire pour le moment.