- ArXiv.org, serveur pionnier de prépublication d’articles scientifiques fondé en 1991, devient à partir du 1er juillet une organisation à but non lucratif indépendante de Cornell University
- Cette indépendance vise à élargir la base de donateurs et renforcer les équipes techniques, afin de répondre à la hausse rapide des soumissions, qui atteignent près de 300 000 par an, ainsi qu’au problème des articles médiocres générés par l’IA (AI slop)
- Au cours des deux dernières années, la pression financière s’est accentuée avec un déficit d’exploitation et une hausse de 50 % du volume des soumissions ; Cornell a couvert en 2025 un déficit de 297 000 dollars et fourni 819 000 dollars d’aide en nature
- Le fondateur Paul Ginsparg souligne qu’il est difficile pour une université de maintenir sur le long terme une infrastructure mondiale de recherche, et estime que l’indépendance est essentielle pour assurer la pérennité
- Cette décision rappelle les cas d’indépendance de bioRxiv et medRxiv ; ArXiv démarre avec une situation financière initiale stable, avec des financements assurés pour les prochaines années
La décision d’indépendance d’ArXiv
- ArXiv.org a été lancé en 1991 comme plateforme de diffusion rapide et gratuite de preprints scientifiques, et a été hébergé par Cornell University pendant plus de 20 ans
- À partir du 1er juillet, il devient une organisation à but non lucratif indépendante, et recrute actuellement le futur directeur général (CEO) de la nouvelle structure
- Greg Morrisett, doyen associé de Cornell Tech, explique que cette indépendance aidera à attirer des donateurs plus variés et à renforcer l’infrastructure technique
- Plus de 300 000 preprints devraient être publiés cette année
- Des financements sont aussi nécessaires pour faire face au problème des articles médiocres rédigés par l’IA (AI slop)
Structure financière et pression liée à la croissance
- Depuis 2022, le nombre de soumissions a augmenté de 50 %, ce qui a conduit à porter les effectifs à 27 personnes
- En 2025, un déficit de 297 000 dollars a été enregistré, et Cornell l’a compensé
- Cornell a également fourni 819 000 dollars d’aide en nature
- Les coûts annuels de fonctionnement d’ArXiv s’élèvent à 6,7 millions de dollars
- Plus de 270 institutions soutiennent ArXiv en versant une cotisation annuelle
- Certaines paient jusqu’à 10 000 dollars par an
- Les institutions membres disposent d’un droit de participation à la gouvernance et d’un accès aux données d’utilisation
- Parmi les principaux soutiens figurent la Simons Foundation et Schmidt Sciences, qui ont récemment financé des mises à niveau techniques
Pourquoi pousser vers l’indépendance
- Au sein même de Cornell Tech, il existait une concurrence pour les financements, et certains groupes s’inquiétaient d’une influence excessive de Cornell
- Morrisett, les responsables d’ArXiv et les donateurs ont jugé que l’indépendance était la meilleure option pour diversifier et renforcer les financements
- Le fondateur Paul Ginsparg a lui aussi recommandé cette évolution
- Il estime que les universités manquent d’expérience dans la gestion d’infrastructures mondiales de recherche sur le long terme
- Cornell avait une capacité limitée à recruter des développeurs logiciels, et le site conserve encore une forme très simple
- Cornell et Simons ont mis en place des financements de stabilisation initiaux afin qu’ArXiv puisse démarrer sans déficit
- Il n’existe aucun projet de hausse des cotisations à court terme
Réactions et inquiétudes dans le monde académique
- Certains scientifiques ont exprimé leurs inquiétudes concernant une possible commercialisation et le salaire d’environ 300 000 dollars du futur CEO
- ArXiv rejette ces critiques
- Ginsparg dit comprendre ces préoccupations, mais rappelle que le fonctionnement d’ArXiv a toujours reposé sur une base financière fragile
- Il compare la situation au film de 1914 Perils of Pauline, en disant qu’« il a toujours été en situation périlleuse »
Le rôle du fondateur Ginsparg et les plans à venir
- Ginsparg est toujours professeur à Cornell et continue de participer au fonctionnement d’ArXiv
- Il dirige ArXiv depuis 35 ans et envisage progressivement de réduire son rôle puis de prendre sa retraite
- Il aidera à l’installation de la nouvelle organisation à but non lucratif, mais prévoit à long terme de transmettre le relais à son successeur
Comparaison avec d’autres serveurs de preprints
- L’indépendance d’ArXiv est comparable au cas de bioRxiv et medRxiv, devenus indépendants de Cold Spring Harbor Laboratory pour être transférés à openRxiv
- Les trois plateformes cherchent à assurer leur pérennité grâce à une structure indépendante à but non lucratif
1 commentaires
Avis sur Hacker News
L’annonce récente selon laquelle arXiv refuserait les articles de synthèse et les position papers donne l’impression que la plateforme devient de plus en plus centrée sur les « opinions »
À l’origine, arXiv n’était qu’un service d’hébergement de PDF, chargé d’apporter le minimum de crédibilité nécessaire pour qu’un article puisse être cité avant sa publication officielle
Mais avec le temps, surtout en ML, arXiv est devenu en soi une véritable venue de publication officielle
À mesure que le pouvoir d’arXiv grandit, j’ai l’impression qu’il s’éloigne de sa fonction initiale. J’ai du mal à croire que la séparation avec Cornell vise réellement à améliorer sa mission
Les formulations de la déclaration officielle et de la FAQ (lien) sonnent comme les habituelles « paroles rassurantes »
À la question « Quels changements positifs les utilisateurs peuvent-ils attendre ? », la réponse semble surtout être qu’ils verront directement les changements négatifs
Je comprends la vitesse du domaine ML, mais le processus de peer review apporte aussi une vraie valeur. Au lieu de l’abandonner complètement, il faudrait plutôt le réformer
Ce serait bien si une plateforme comme arXiv pouvait entraîner une réforme plus large du monde académique
Les chercheurs ne s’y laissent pas prendre, mais le grand public, si. Il y a récemment tellement de documents de ce type qu’on peut se demander si le système de modération d’arXiv fonctionne encore correctement
Certains ont fait remarquer que le salaire de 300 000 dollars du nouveau CEO d’arXiv était élevé, mais à mon avis, même pour une organisation à but non lucratif, il faut ce niveau pour recruter des talents compétitifs
La déclaration officielle d’arXiv est disponible ici
À mon avis, il est plus important de résoudre le problème de l’indexation (du classement) que celui du filtrage d’arXiv
De la même manière que Google a mis de l’ordre sur un web chaotique avec PageRank, je me demande s’il ne serait pas possible de créer un système de classement académique fondé sur les relations de citation entre articles
Il ne devrait pas s’agir d’un blocage total, mais d’un niveau suffisant pour prévenir les abus. Pour le reste, un système de classement et de tags piloté par les utilisateurs serait préférable
Mettre arXiv en miroir n’est pas techniquement très difficile. Le vrai problème, c’est de déplacer les utilisateurs
Le monde académique est très conservateur quand il s’agit d’adopter de nouveaux systèmes, mais si arXiv devenait réellement inutilisable, il finirait par migrer vers une autre plateforme
arXiv reste encore un simple dépôt de PDF, mais il possède un fort potentiel pour transformer la manière de partager la recherche
S’affranchir de l’influence d’une université pourrait même être une bonne chose. Mais le succès dépendra des capacités de l’équipe dirigeante
Honnêtement, je ne comprends pas bien pourquoi arXiv se sépare de Cornell. Je ne vois pas quel « problème » cela est censé résoudre
Je me suis demandé ce que donnerait un modèle où une institution comme la National Science Foundation (NSF) exploiterait un site comme arXiv
Tout chercheur certifié pourrait y téléverser des articles, et l’activité de review permettrait de gagner un score de confiance
Le système d’endorsement d’arXiv constitue une barrière importante pour les chercheurs indépendants
Sans adresse e-mail institutionnelle ni lien avec des auteurs existants, il est impossible de téléverser dans certains domaines comme cs.NE
Si l’on veut renforcer l’indépendance d’arXiv, il faudrait aussi améliorer l’accessibilité pour les chercheurs non affiliés
Quand on pense que Cornell facture 50 000 dollars de frais de scolarité annuels, un salaire de CEO à 300 000 dollars ne paraît pas si énorme
Vidéo liée : lien YouTube