14 points par GN⁺ 2023-12-22 | 1 commentaires | Partager sur WhatsApp

Un accès équitable à la recherche scientifique

  • arXiv s’efforce de garantir à tous les utilisateurs, y compris les personnes en situation de handicap, un accès équitable à la recherche scientifique.
  • Depuis le 18 décembre 2023, la plateforme génère une version HTML pour tous les articles soumis en TeX/LaTeX (uniquement pour les articles soumis après le 1er décembre et lorsque la conversion HTML réussit).

Ajout du format HTML

  • Le HTML ne remplace pas le PDF, mais constitue un format supplémentaire proposé aux utilisateurs d’arXiv.
  • Les auteurs ont la possibilité de prévisualiser la version HTML au moment de la soumission, comme pour le PDF.
  • En accédant à la page de résumé d’un article, il est possible de voir un lien vers la version HTML juste sous le lien PDF.

Amélioration de l’accessibilité pour les scientifiques en situation de handicap

  • Des scientifiques en situation de handicap rencontraient des obstacles pour accéder aux travaux de recherche, d’où la demande de proposer les articles au format HTML.
  • Les articles au format HTML peuvent être lus plus facilement et plus précisément via des technologies comme les lecteurs d’écran, ce qui aide les chercheurs aveugles, malvoyants ou dyslexiques.

Une phase expérimentale pour la conversion HTML

  • La conversion HTML en est actuellement à une phase expérimentale, et des travaux sont en cours pour en améliorer la précision.
  • Tous les articles ne sont pas convertis parfaitement en HTML, mais l’objectif est de proposer cette fonctionnalité le plus rapidement possible aux chercheurs qui en ont besoin pour des raisons d’accessibilité.
  • Si la conversion HTML échoue pour une soumission, cela n’empêche pas la soumission d’être acceptée ou maintenue, mais il est demandé aux auteurs de vérifier attentivement la version HTML.

Remerciements autour du projet HTML

  • Un message de remerciement est adressé pour ce HTML expérimental, présenté comme une étape majeure pour rendre la science accessible à tous.
  • Merci à tous ceux qui ont collaboré au pilote du projet d’articles HTML d’arXiv, notamment le LaTeX Project et l’équipe LaTeXML du NIST.
  • Pour les utilisateurs familiers avec ar5iv, projet collaboratif d’arXivLabs, cette mise à disposition en HTML correspond à une internalisation complète de ce projet influent.
  • L’objectif final est de backfiller l’ensemble du corpus d’arXiv afin de fournir une version HTML à tous les articles, mais pour l’instant cette fonctionnalité n’est proposée que pour les nouveaux articles.
  • Des remerciements sont également adressés à tous les utilisateurs d’arXiv ayant rédigé des rapports de bugs sur le projet d’articles HTML ; l’équipe les analyse actuellement et prévoit une première vague d’améliorations pour la nouvelle année.

L’avis de GN⁺

  • La mise à disposition du format HTML par arXiv constitue une avancée importante pour améliorer l’accessibilité à la recherche, en particulier pour les scientifiques en situation de handicap.
  • Ce changement contribuera à réduire les barrières techniques au sein de la communauté scientifique et à renforcer l’inclusivité de la recherche.
  • Malgré son caractère expérimental, la décision d’arXiv de déployer rapidement cette fonctionnalité montre une attitude positive qui fait passer les besoins des chercheurs en priorité.

1 commentaires

 
GN⁺ 2023-12-22
Commentaires Hacker News
  • L’article ne contient pas de lien vers un exemple HTML, mais voici un lien pris au hasard : lien vers un exemple HTML arXiv. C’est sympa de voir que le mode sombre est pris en charge. Je ne vois pas de bouton pour basculer, mais le rendu suit le mode système. Cela semble devoir nettement améliorer l’accessibilité d’arXiv sur mobile.
    • Trente ans après l’invention du HTML pour favoriser l’accessibilité et la collaboration dans la recherche et le monde académique, la Maison-Blanche a publié de nouvelles directives d’accessibilité. C’est la première fois qu’une nouvelle politique officielle est publiée en HTML plutôt qu’en PDF. lien vers les directives d’accessibilité de la Maison-Blanche
    • Si vous voulez vous tenir informé des nouveaux articles importants sur l’IA/ML sur arXiv, vous pouvez jeter un œil à Emergent Mind. Le site suit les mentions d’articles arXiv sur les réseaux sociaux (Hacker News, Reddit, X, YouTube, GitHub, etc.) et les classe en fonction de l’activité sociale et de l’heure de publication. Pour chaque article, il fournit un résumé avec GPT-4, ainsi que des liens vers les discussions sur les réseaux sociaux, les citations de l’article et des travaux connexes. C’est encore un site récent et peu partagé. Les retours et demandes d’amélioration sont les bienvenus.
    • S’il y a des articles sans lien HTML dans la barre latérale, je me demande comment on peut savoir pourquoi ils ne sont pas rendus en HTML et comment corriger cela.
    • Ce serait bien de donner aux auteurs la possibilité d’envoyer leur propre version HTML en plus de la version PDF, au lieu de dépendre uniquement du processus de conversion automatique.
      • Si les auteurs sont contactés au sujet de problèmes dans la version HTML de leur article, ils risquent d’être frustrés de ne pas avoir de moyen de corriger cela autrement qu’en espérant qu’une modification du PDF affecte la génération HTML. Il est plus simple de corriger directement les problèmes de mise en forme dans le PDF.
      • Il serait aussi intéressant d’autoriser des expérimentations sur des formats alternatifs pour les articles. Par exemple, un article pourrait inclure un bac à sable permettant d’essayer le langage de programmation discuté, ou, pour un article sur le calcul différentiel multivarié, permettre d’interagir avec le tracé 3D d’une fonction.
    • Miser sur le web est toujours une très bonne décision.
    • L’outil utilisé pour ce service est arXiv-readability. Je mets le lien pour vous faire gagner quelques clics.
    • Le PDF est bien supérieur au HTML pour le rendu des documents textuels. Et l’écart est important. C’était déjà possible il y a 10 ans, voire 15 à 20 ans. Si cela n’a pas été fait, ce n’est pas simplement par inertie. LaTeX et le PDF offrent un bien meilleur rendu du texte, et un format statique fige un état donné dans le temps, ce qui est utile pour les lecteurs ultérieurs. Contrairement à la nature intrinsèquement fluide du HTML. Et encore une fois, le rendu n’est pas comparable, et cela transmet consciemment ou inconsciemment un signal de qualité.
    • J’espère qu’arXiv ne cessera pas de proposer les articles au format PDF. Je préfère aussi lire des PDF sur ordinateur.
    • Quand j’ouvre de gros PDF sur arXiv (plus de 100 Mo, ce qui est courant pour les articles de ML axés sur la génération d’images en haute résolution), rien ne s’affiche pendant plus de 10 secondes à part une barre de chargement. Je me demande d’où vient ce délai. Est-ce un problème réseau, ou bien Chrome est-il vraiment lent pour rendre de gros PDF ? Faut-il télécharger entièrement le PDF avant de commencer le rendu ? Quoi qu’il en soit, c’est mon seul reproche envers arXiv, et des documents HTML rendus de manière progressive, avec le texte qui se charge immédiatement, seraient une grande amélioration.