56 points par xguru 2026-03-16 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Un parseur de contenu qui supprime les éléments inutiles d’une page web — commentaires, barres latérales, en-têtes et pieds de page — pour extraire uniquement le contenu principal en HTML/Markdown
  • Pour les vidéos YouTube, il peut aussi extraire les dialogues en les séparant par intervenant (à partir de la version 0.12.0)
  • Développé pour Obsidian Web Clipper, mais utilisable dans divers environnements comme le navigateur ou Node.js
  • Conçu comme une alternative à Mozilla Readability, avec un traitement plus flexible et une sortie plus cohérente
    • Réduit au minimum la suppression d’éléments incertains
    • Prend en charge une sortie normalisée pour les notes de bas de page, formules et blocs de code
    • Détecte les éléments inutiles grâce à l’analyse des styles mobiles
    • Extrait automatiquement davantage de métadonnées, y compris les métadonnées schema.org
  • Prend en charge une interface CLI, permettant d’analyser directement du HTML ou des URL depuis le terminal
  • Licence MIT

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.