Pourquoi les systèmes de fichiers reviennent au centre de l’attention

(madalitso.me)

36 points par GN⁺ 2026-03-09 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Dans le récent écosystème des agents IA, les systèmes de fichiers reviennent au premier plan et s’imposent comme un moyen de gérer un contexte persistant distinct des bases de données
La fenêtre de contexte des LLM ressemble davantage à un tableau blanc qui s’efface qu’à une mémoire durable, et le système de fichiers constitue le moyen de stockage persistant le plus simple pour résoudre ce problème
Claude Code, Cursor et d’autres implémentent une mémoire à long terme via un stockage du contexte fondé sur des fichiers ; des fichiers comme CLAUDE.md et aboutme.md servent à contenir l’identité de l’agent et les informations sur son environnement
La gestion du contexte basée sur le système de fichiers devient un sujet central, et de grands acteurs comme LlamaIndex, LangChain, Oracle et Archil publient successivement articles et produits sur le sujet
Alors que prolifèrent les fichiers de contexte d’agent comme CLAUDE.md, AGENTS.md et .cursorrules, le format Agent Skills (SKILL.md) d’Anthropic a été adopté par Microsoft, OpenAI, GitHub et Cursor, gagnant ainsi en interopérabilité
Selon une étude de l’ETH Zürich, les fichiers de contexte peuvent au contraire réduire le taux de réussite des tâches et augmenter de plus de 20 % le coût d’inférence ; il faut donc n’y décrire que les exigences minimales
Les fichiers ne dépendent pas d’une application particulière et s’imposent, à l’ère des agents IA, comme une interface ouverte permettant le passage d’un outil à l’autre, la combinaison de workflows et le maintien de la continuité

Everyone is talking about files : tout le monde parle des fichiers

LlamaIndex a publié "Files Are All You Need", et LangChain s’est penché sur la manière dont les agents peuvent utiliser les systèmes de fichiers pour le context engineering
Oracle (oui, cet Oracle-là !) a publié un article sur la comparaison entre systèmes de fichiers et bases de données pour la gestion efficace de la mémoire des agents IA, tandis que Dan Abramov a proposé un système de fichiers social basé sur le AT Protocol
Archil construit des volumes cloud parce que les agents veulent un système de fichiers POSIX
Jerry Liu de LlamaIndex affirme qu’au lieu d’"un agent avec des centaines d’outils", un agent doté d’un système de fichiers et de 5 à 10 outils peut être plus polyvalent qu’un agent équipé de plus de 100 outils MCP
Karpathy souligne que si Claude Code fonctionne, c’est parce qu’il s’exécute directement sur l’ordinateur, l’environnement, les données et le contexte de l’utilisateur ; il estime qu’OpenAI s’est trompé de direction en se concentrant sur le déploiement de conteneurs cloud
Aujourd’hui, les agents de programmation représentent l’essentiel des cas d’usage concrets de l’IA, et Anthropic se rapproche de la rentabilité grâce au fait que Claude Code, son outil CLI, tire une part importante de ses revenus

La fenêtre de contexte n’est pas une mémoire

La mémoire humaine comprend le stockage à long terme, le rappel sélectif et l’oubli des informations inutiles, tandis que la fenêtre de contexte des LLM ressemble à un tableau blanc continuellement effacé
Lorsqu’on utilise Claude Code, à mesure que l’alerte "context left until auto-compact" approche, le contexte accumulé par l’agent — base de code, préférences, décisions prises, etc. — est compressé ou perdu
Le système de fichiers résout cela de la manière la plus simple : on écrit l’historique dans des fichiers, puis on les relit quand nécessaire
- CLAUDE.md fournit un contexte persistant sur le projet
- Cursor enregistre les anciens historiques de chat sous forme de fichiers consultables
- Le fichier aboutme.md joue le rôle de descripteur d’identité portable contenant préférences, compétences et style de travail, transportable d’une application à l’autre sans orchestration par API

Étude de l’ETH Zürich : le paradoxe des fichiers de contexte

Un article récent de l’ETH Zürich évalue si les fichiers de contexte au niveau du dépôt aident réellement les agents de programmation à accomplir leurs tâches
Les résultats sont contre-intuitifs : sur plusieurs agents et modèles, les fichiers de contexte réduisent au contraire le taux de réussite des tâches, tandis que le coût d’inférence augmente de plus de 20 %
- Les agents recevant des fichiers de contexte explorent plus largement, exécutent davantage de tests et parcourent plus de fichiers, mais mettent plus de temps à atteindre le code qui doit réellement être modifié
- Le fichier agit comme une checklist que l’agent suit trop scrupuleusement
La conclusion de l’article n’est pas « n’utilisez pas de fichiers de contexte », mais plutôt que les exigences inutiles rendent les tâches plus difficiles et que les fichiers de contexte ne doivent décrire que le strict minimum
Le problème ne vient pas de la couche persistante du système de fichiers elle-même, mais de l’habitude consistant à rédiger CLAUDE.md comme un document d’onboarding de 2 000 mots

Le format de fichier devient l’API — mais quel fichier ?

Aujourd’hui coexistent CLAUDE.md, AGENTS.md, copilot-instructions.md et .cursorrules ; s’il existe un consensus sur le fait que les agents ont besoin d’un contexte persistant fondé sur le système de fichiers, le nom des fichiers et le format de leur contenu ne font pas encore l’objet d’un accord
Dans son article sur le système de fichiers social, Dan Abramov propose un principe de conception central : l’AT Protocol traite les données utilisateur comme des fichiers dans un dépôt personnel, et les applications évitent les collisions via des espaces de noms fondés sur des noms de domaine, sans avoir à s’accorder sur ce qu’est exactement un « post »
- La base de données de chaque application devient une donnée dérivée, c’est-à-dire une vue matérialisée en cache de tous les dossiers utilisateurs
Anthropic a présenté Agent Skills comme standard ouvert : le format SKILL.md a été adopté par Microsoft, OpenAI, Atlassian, GitHub et Cursor
- Une skill écrite pour Claude Code fonctionne aussi dans Codex et Copilot — le format de fichier devient l’API
NanoClaw est un framework léger d’assistant IA personnel qui adopte un modèle de « skills plutôt que fonctionnalités »
- Si l’on veut le support de Telegram, au lieu d’un module Telegram, une skill /add-telegram (un fichier Markdown) apprend à Claude Code comment l’intégrer
- Parce qu’elles sont des fichiers, les skills sont portables, auditables et combinables — nul besoin de serveur MCP ni de marketplace de plugins
C’est cela, l’interopérabilité sans coordination : si deux applications peuvent lire du Markdown, elles peuvent partager du contexte ; si elles comprennent le format SKILL.md, elles peuvent partager des fonctionnalités ; sans contrat de partenariat ni réunion d’un organisme de normalisation, c’est le format de fichier lui-même qui joue le rôle de coordination

Déplacement du goulot d’étranglement

L’architecture de données traditionnelle a été conçue sur l’hypothèse que le stockage était le goulot d’étranglement, mais à mesure que la capacité de traitement a dépassé les E/S de stockage, le paradigme a basculé vers la séparation du stockage et du calcul (S3 + clusters de calcul temporaires)
Un phénomène similaire apparaît avec les agents IA : le goulot d’étranglement n’est plus la performance du modèle ni le calcul, mais le contexte
- Les modèles sont suffisamment intelligents, mais oublient
- Le système de fichiers est la manière la plus efficace de gérer un contexte persistant exactement là où l’agent s’exécute — sur la machine du développeur, dans l’environnement et au plus près des données déjà présentes

Le système de fichiers est déjà un graphe

Sur Twitter, certains ont fait remarquer que dire « il n’y a pas besoin de graphe pour les agents si l’on utilise un système de fichiers » revient en réalité à nier qu’on utilise déjà un graphe
- Un système de fichiers est une structure en arbre composée de répertoires, sous-répertoires et fichiers, autrement dit un graphe orienté acyclique (DAG)
- Quand un agent utilise ls, grep, lit des fichiers ou suit des références, il parcourt déjà un graphe
Dans l’article d’Oracle, Richmond formule la distinction la plus nette : le système de fichiers gagne comme interface, la base de données gagne comme couche sous-jacente
- Dès qu’il faut gérer l’accès concurrent, la recherche sémantique à grande échelle, la déduplication ou la pondération par fraîcheur, on finit par construire son propre index, ce qui revient en pratique à une base de données
L’interface fichier est puissante parce qu’elle est universelle et déjà comprise par les LLM, tandis que la couche sous-jacente basée sur une base de données est puissante parce qu’elle fournit les garanties nécessaires à l’exploitation réelle
L’avenir n’est pas fichiers contre bases de données, mais une architecture où le fichier est l’interface d’interaction pour les humains et les agents, avec en dessous une couche adaptée au cas d’usage

Une redéfinition de l’informatique personnelle

Le système de fichiers pourrait redéfinir le sens même de l’informatique personnelle à l’ère de l’IA
- Données, contexte, préférences, skills et mémoire existeraient dans des formats possédés par l’utilisateur, lisibles par n’importe quel agent et non enfermés dans une application particulière
- aboutme.md fonctionne dans OpenClaw/NanoClaw aujourd’hui, et dans de nouveaux outils demain
- Les fichiers de skills sont portables, et le contexte de projet se maintient au-delà des outils
C’est une vision proche de ce que l’informatique personnelle visait à l’origine, avant que tout ne migre vers des applications SaaS fermées et des bases de données propriétaires
- Les fichiers sont le protocole ouvert originel, et à mesure que les agents IA deviennent l’interface principale de l’informatique, ils forment une couche d’interopérabilité permettant, sans demander la permission à quiconque, de changer d’outil, de combiner des workflows et de préserver la continuité entre applications
Cette vision garde toutefois une part d’idéalisme : l’histoire des formats ouverts est pleine de standards victorieux sur le papier mais inefficaces dans la pratique
- Les entreprises ont tout intérêt à rendre leurs fichiers de contexte légèrement différents pour maintenir un coût de changement élevé
- Le fait même que CLAUDE.md, AGENTS.md et .cursorrules coexistent au lieu de converger vers un format universel montre que la fragmentation est l’état par défaut
- L’étude de l’ETH Zürich rappelle que même lorsqu’un format existe, il est difficile d’écrire un bon fichier de contexte, et qu’un mauvais fichier peut être pire que pas de fichier du tout
Le message central de Dan Abramov :

Nos souvenirs, nos pensées et nos designs doivent survivre plus longtemps que le logiciel qui les a produits
- Ce n’est pas seulement un argument technique, mais une question de valeurs ; si le système de fichiers convient à ce rôle, ce n’est pas parce que c’est la meilleure technologie, mais parce que c’est la seule technologie qui appartient déjà à l’utilisateur

Pourquoi les systèmes de fichiers reviennent au centre de l’attention

Everyone is talking about files : tout le monde parle des fichiers

La fenêtre de contexte n’est pas une mémoire

Étude de l’ETH Zürich : le paradoxe des fichiers de contexte

Le format de fichier devient l’API — mais quel fichier ?

Déplacement du goulot d’étranglement

Le système de fichiers est déjà un graphe

Une redéfinition de l’informatique personnelle

À lire aussi

Aucun commentaire pour le moment.