Paper to HTML - conversion de publications en HTML plus facile à lire
(papertohtml.org)<p>- Conversion en HTML du contenu de PDF, LaTeX et XML PubMed Central à l’aide du machine learning <br />
- Objectif : améliorer l’accessibilité <br />
- Prototype expérimental de Semantic Scholar, le moteur de recherche de publications basé sur l’IA <br />
- Actuellement, seules les images et les contenus extraits sont mis en cache, et le service sert uniquement à accélérer l’accès pour les personnes qui téléversent exactement le même document. Les fichiers téléversés ne sont pas conservés <br />
- Limites<br />
→ Les tableaux (`Table`) sont extraits sous forme d’images <br />
→ Le contenu mathématique (`Math`) a une précision faible ou n’est presque pas extrait <br />
→ Le traitement de LaTeX/PubMed peut être partiellement moins complet que celui des PDF <br />
- Il est prévu d’ajouter à l’avenir des fonctionnalités d’accessibilité à Semantic Scholar </p>
3 commentaires