5 points par GN⁺ 2026-03-21 | 1 commentaires | Partager sur WhatsApp
  • ArXiv.org, serveur pionnier de prépublication d’articles scientifiques fondé en 1991, devient à partir du 1er juillet une organisation à but non lucratif indépendante de Cornell University
  • Cette indépendance vise à élargir la base de donateurs et renforcer les équipes techniques, afin de répondre à la hausse rapide des soumissions, qui atteignent près de 300 000 par an, ainsi qu’au problème des articles médiocres générés par l’IA (AI slop)
  • Au cours des deux dernières années, la pression financière s’est accentuée avec un déficit d’exploitation et une hausse de 50 % du volume des soumissions ; Cornell a couvert en 2025 un déficit de 297 000 dollars et fourni 819 000 dollars d’aide en nature
  • Le fondateur Paul Ginsparg souligne qu’il est difficile pour une université de maintenir sur le long terme une infrastructure mondiale de recherche, et estime que l’indépendance est essentielle pour assurer la pérennité
  • Cette décision rappelle les cas d’indépendance de bioRxiv et medRxiv ; ArXiv démarre avec une situation financière initiale stable, avec des financements assurés pour les prochaines années

La décision d’indépendance d’ArXiv

  • ArXiv.org a été lancé en 1991 comme plateforme de diffusion rapide et gratuite de preprints scientifiques, et a été hébergé par Cornell University pendant plus de 20 ans
  • À partir du 1er juillet, il devient une organisation à but non lucratif indépendante, et recrute actuellement le futur directeur général (CEO) de la nouvelle structure
  • Greg Morrisett, doyen associé de Cornell Tech, explique que cette indépendance aidera à attirer des donateurs plus variés et à renforcer l’infrastructure technique
    • Plus de 300 000 preprints devraient être publiés cette année
    • Des financements sont aussi nécessaires pour faire face au problème des articles médiocres rédigés par l’IA (AI slop)

Structure financière et pression liée à la croissance

  • Depuis 2022, le nombre de soumissions a augmenté de 50 %, ce qui a conduit à porter les effectifs à 27 personnes
  • En 2025, un déficit de 297 000 dollars a été enregistré, et Cornell l’a compensé
    • Cornell a également fourni 819 000 dollars d’aide en nature
    • Les coûts annuels de fonctionnement d’ArXiv s’élèvent à 6,7 millions de dollars
  • Plus de 270 institutions soutiennent ArXiv en versant une cotisation annuelle
    • Certaines paient jusqu’à 10 000 dollars par an
    • Les institutions membres disposent d’un droit de participation à la gouvernance et d’un accès aux données d’utilisation
  • Parmi les principaux soutiens figurent la Simons Foundation et Schmidt Sciences, qui ont récemment financé des mises à niveau techniques

Pourquoi pousser vers l’indépendance

  • Au sein même de Cornell Tech, il existait une concurrence pour les financements, et certains groupes s’inquiétaient d’une influence excessive de Cornell
  • Morrisett, les responsables d’ArXiv et les donateurs ont jugé que l’indépendance était la meilleure option pour diversifier et renforcer les financements
  • Le fondateur Paul Ginsparg a lui aussi recommandé cette évolution
    • Il estime que les universités manquent d’expérience dans la gestion d’infrastructures mondiales de recherche sur le long terme
    • Cornell avait une capacité limitée à recruter des développeurs logiciels, et le site conserve encore une forme très simple
  • Cornell et Simons ont mis en place des financements de stabilisation initiaux afin qu’ArXiv puisse démarrer sans déficit
    • Il n’existe aucun projet de hausse des cotisations à court terme

Réactions et inquiétudes dans le monde académique

  • Certains scientifiques ont exprimé leurs inquiétudes concernant une possible commercialisation et le salaire d’environ 300 000 dollars du futur CEO
    • ArXiv rejette ces critiques
  • Ginsparg dit comprendre ces préoccupations, mais rappelle que le fonctionnement d’ArXiv a toujours reposé sur une base financière fragile
    • Il compare la situation au film de 1914 Perils of Pauline, en disant qu’« il a toujours été en situation périlleuse »

Le rôle du fondateur Ginsparg et les plans à venir

  • Ginsparg est toujours professeur à Cornell et continue de participer au fonctionnement d’ArXiv
  • Il dirige ArXiv depuis 35 ans et envisage progressivement de réduire son rôle puis de prendre sa retraite
  • Il aidera à l’installation de la nouvelle organisation à but non lucratif, mais prévoit à long terme de transmettre le relais à son successeur

Comparaison avec d’autres serveurs de preprints

  • L’indépendance d’ArXiv est comparable au cas de bioRxiv et medRxiv, devenus indépendants de Cold Spring Harbor Laboratory pour être transférés à openRxiv
  • Les trois plateformes cherchent à assurer leur pérennité grâce à une structure indépendante à but non lucratif

1 commentaires

 
GN⁺ 2026-03-21
Avis sur Hacker News
  • L’annonce récente selon laquelle arXiv refuserait les articles de synthèse et les position papers donne l’impression que la plateforme devient de plus en plus centrée sur les « opinions »
    À l’origine, arXiv n’était qu’un service d’hébergement de PDF, chargé d’apporter le minimum de crédibilité nécessaire pour qu’un article puisse être cité avant sa publication officielle
    Mais avec le temps, surtout en ML, arXiv est devenu en soi une véritable venue de publication officielle
    À mesure que le pouvoir d’arXiv grandit, j’ai l’impression qu’il s’éloigne de sa fonction initiale. J’ai du mal à croire que la séparation avec Cornell vise réellement à améliorer sa mission
    Les formulations de la déclaration officielle et de la FAQ (lien) sonnent comme les habituelles « paroles rassurantes »
    À la question « Quels changements positifs les utilisateurs peuvent-ils attendre ? », la réponse semble surtout être qu’ils verront directement les changements négatifs

    • En physique, surtout en théorie, publier un brouillon sur arXiv puis le réviser après avoir reçu des retours est une pratique ancienne. Ce n’est pas un problème propre au ML
    • Je pense un peu la même chose. En tant que personne qui utilise le ML sans en faire sa spécialité, je vois un conflit entre ceux qui pensent qu’arXiv suffit à lui seul et ceux qui estiment encore que seule la publication dans une revue formelle constitue de la vraie recherche
      Je comprends la vitesse du domaine ML, mais le processus de peer review apporte aussi une vraie valeur. Au lieu de l’abandonner complètement, il faudrait plutôt le réformer
      Ce serait bien si une plateforme comme arXiv pouvait entraîner une réforme plus large du monde académique
    • L’idée selon laquelle « plus arXiv a peu de pouvoir, mieux il remplit sa fonction » fait penser à la rule of least power (lien Wikipédia)
    • Pour avoir moi-même traversé le processus de publication, l’édition dans les revues classiques devient de plus en plus fatigante, avec des frais de publication élevés, une interface peu pratique et des reviews sans intérêt. Du coup, déposer sur arXiv et s’arrêter là paraît préférable
    • Ces derniers temps, on voit aussi apparaître sur arXiv des articles frauduleux dans le domaine de la santé et des compléments alimentaires. Il arrive même que des faux articles générés avec ChatGPT soient mis en ligne puis promus comme des « recherches publiées »
      Les chercheurs ne s’y laissent pas prendre, mais le grand public, si. Il y a récemment tellement de documents de ce type qu’on peut se demander si le système de modération d’arXiv fonctionne encore correctement
  • Certains ont fait remarquer que le salaire de 300 000 dollars du nouveau CEO d’arXiv était élevé, mais à mon avis, même pour une organisation à but non lucratif, il faut ce niveau pour recruter des talents compétitifs

    • Hors des États-Unis, 300 000 dollars paraissent une somme absurde. Le système de rémunération américain est anormalement élevé
    • Vu l’influence mondiale d’arXiv, c’est même plutôt bas. Il faut toutefois aussi considérer le niveau de salaire des autres employés
    • En dehors de la Silicon Valley, c’est clairement une somme importante. arXiv n’est pas une organisation dont le but est de maximiser la valeur pour l’actionnaire, donc une rémunération excessive n’est pas nécessaire
    • C’est un problème quand une association crée des « postes confortables » qui gaspillent les dons. Après tout, arXiv n’est rien d’autre qu’un dossier dans le cloud, donc un tel salaire est difficile à justifier
    • Le CEO n’a pas forcément besoin d’être un professeur du calibre de la titularisation. Ce n’est qu’un simple dépôt de preprints
  • La déclaration officielle d’arXiv est disponible ici

    • Ce lien est plus essentiel que l’article d’origine. Le contenu de l’article a été rédigé à partir de l’offre d’emploi du CEO
  • À mon avis, il est plus important de résoudre le problème de l’indexation (du classement) que celui du filtrage d’arXiv
    De la même manière que Google a mis de l’ordre sur un web chaotique avec PageRank, je me demande s’il ne serait pas possible de créer un système de classement académique fondé sur les relations de citation entre articles

    • Je suis d’accord. Si arXiv devient comme une revue qui empêche la publication des articles, sa raison d’être disparaît. Mais avec l’invasion actuelle des articles de spam générés par des LLM, un minimum de filtrage reste nécessaire
      Il ne devrait pas s’agir d’un blocage total, mais d’un niveau suffisant pour prévenir les abus. Pour le reste, un système de classement et de tags piloté par les utilisateurs serait préférable
    • PageRank lui-même s’inspirait à l’origine de la bibliométrie, mais les classements académiques actuels sont déjà biaisés. Corriger simplement le ranking ne suffira pas
    • Comme site de référence lié au sujet, je recommande readabstracted.com
  • Mettre arXiv en miroir n’est pas techniquement très difficile. Le vrai problème, c’est de déplacer les utilisateurs
    Le monde académique est très conservateur quand il s’agit d’adopter de nouveaux systèmes, mais si arXiv devenait réellement inutilisable, il finirait par migrer vers une autre plateforme
    arXiv reste encore un simple dépôt de PDF, mais il possède un fort potentiel pour transformer la manière de partager la recherche
    S’affranchir de l’influence d’une université pourrait même être une bonne chose. Mais le succès dépendra des capacités de l’équipe dirigeante

  • Honnêtement, je ne comprends pas bien pourquoi arXiv se sépare de Cornell. Je ne vois pas quel « problème » cela est censé résoudre

    • La raison est clairement indiquée dans l’article
    • Je pense que le problème mentionné au sixième paragraphe mérite effectivement d’être résolu
  • Je me suis demandé ce que donnerait un modèle où une institution comme la National Science Foundation (NSF) exploiterait un site comme arXiv
    Tout chercheur certifié pourrait y téléverser des articles, et l’activité de review permettrait de gagner un score de confiance

    • Quand on voit les coupes budgétaires dans la recherche de ces dernières années, c’est presque rassurant que le gouvernement n’exploite pas directement une infrastructure aussi essentielle qu’arXiv
    • Un modèle délégué par l’État est aussi possible, comme lorsque le NIST gère le dépôt CVE via MITRE
  • Le système d’endorsement d’arXiv constitue une barrière importante pour les chercheurs indépendants
    Sans adresse e-mail institutionnelle ni lien avec des auteurs existants, il est impossible de téléverser dans certains domaines comme cs.NE
    Si l’on veut renforcer l’indépendance d’arXiv, il faudrait aussi améliorer l’accessibilité pour les chercheurs non affiliés

  • Quand on pense que Cornell facture 50 000 dollars de frais de scolarité annuels, un salaire de CEO à 300 000 dollars ne paraît pas si énorme

    • À l’échelle de New York, la valeur réelle de 300 000 dollars est assez faible
    • Vu le niveau actuel des frais d’inscription universitaires, on mesure à quel point ces montants sont irréalistes
  • Vidéo liée : lien YouTube