38 points par xguru 2026-04-06 | 9 commentaires | Partager sur WhatsApp
  • Un binaire Rust unique (Windows/macOS/Linux) qui filtre et compresse la sortie des commandes CLI exécutées par les outils de codage IA avant de la transmettre au LLM, pour réduire de 60 à 90 % le nombre de tokens
  • Prend en charge plus de 100 commandes comme git, grep, ls, cargo test, et applique 4 stratégies avant d’envoyer la sortie dans le contexte du LLM : filtrage intelligent, regroupement, troncature et déduplication
  • Compatible avec 10 outils de codage IA, dont Claude Code, Codex, Cursor, Gemini CLI ; lors de l’installation du hook, les commandes bash sont automatiquement et de façon transparente réécrites vers la commande équivalente de rtk
    • Ce hook ne s’applique qu’aux appels d’outils Bash ; les outils intégrés de Claude Code comme Read, Grep, Glob, etc. contournent ce mécanisme, donc pour appliquer le filtrage RTK il faut utiliser des commandes shell ou des commandes rtk explicites
  • Pour une session Claude Code de 30 minutes, l’économie estimée est de ~23 900 tokens (environ 80 % de réduction) contre ~118 000 tokens en standard
    • Jusqu’à 90 % de réduction avec des lanceurs de tests comme cargo test/npm test, pytest, go test
  • Prise en main
    # 1. Installation  
    rtk init -g                     # Claude Code / Copilot (par défaut)  
    rtk init -g --gemini            # Gemini CLI  
    rtk init -g --codex             # Codex (OpenAI)  
    rtk init -g --agent cursor      # Cursor  
    # 2. Redémarrer ensuite l’outil IA  
    git status  # fonctionne désormais comme rtk git status  
    
  • Licence Apache-2.0

9 commentaires

 
kurthong 2026-04-06

Au final, c’est un compromis avec la qualité, et je me demande aussi si cela ne risque pas de se transformer en une structure où l’on consomme davantage de tokens pour restaurer la qualité perdue.

 
ksundong 2026-04-06

Je l’ai déjà utilisé auparavant, mais je l’ai retiré parce que Claude finissait sans cesse par consommer encore plus de tokens pour résoudre les problèmes causés par rtk.
(Par exemple, quand on envoie une requête JSON avec curl, il génère un JSON invalide, jq renvoie une erreur, puis Claude se met à déboguer ça en y brûlant des tokens, et au final on en revient à refaire la requête curl brute pour la parser avec jq.)
Cela dit, je pense que l’intention en elle-même est bonne, donc ça pourrait valoir le coup de l’utiliser une fois qu’il sera stabilisé.

 
moon5g 2026-04-06

Je ne sais pas si ça réduit vraiment. J’ai beau dire à l’agent d’utiliser sans arrêt la commande rtk ls.., il ne l’utilise pas.

 
yowuu 2026-04-06

Personnellement, je l’utilise aussi… mais à cause de la compression de rtk, il arrive que Claude Code ne parvienne pas à récupérer dans le résultat des commandes le contexte dont il a besoin, donc j’ai l’impression que cela dépend des cas.

 
anyjava 2026-04-06

J’avais aussi trouvé ça dommage sur ce point-là !

Une mise à jour récente permet d’enregistrer la sortie complète dans un fichier séparé afin que le LLM puisse la lire si nécessaire~

 
vwjdalsgkv 2026-04-06

Il semble y avoir quelques effets secondaires dans les cas d’usage d’autres utilisateurs.
J’espère que cela sera surmonté rapidement et bien appliqué.
https://reddit.com/r/ClaudeCode/…

 
blacksocks 2026-04-06

S’il permet vraiment de bien les réduire, ce serait vraiment super !

 
t7vonn 2026-04-06

Bonne idée.
Cela dit, comme l’entraînement a probablement été fait sur la base d’une sortie CLI classique, j’ai un léger doute sur le fait qu’en condensant ainsi, la sortie restera aussi bonne qu’avant.
Je vais l’essayer.

 
cjinzy 2026-04-06

Il va falloir comparer avec contextmode...