rtk - Un proxy CLI qui réduit la consommation de tokens des LLM de 60 à 90 %
(github.com/rtk-ai)- Un binaire Rust unique (Windows/macOS/Linux) qui filtre et compresse la sortie des commandes CLI exécutées par les outils de codage IA avant de la transmettre au LLM, pour réduire de 60 à 90 % le nombre de tokens
- Prend en charge plus de 100 commandes comme git, grep, ls, cargo test, et applique 4 stratégies avant d’envoyer la sortie dans le contexte du LLM : filtrage intelligent, regroupement, troncature et déduplication
- Compatible avec 10 outils de codage IA, dont Claude Code, Codex, Cursor, Gemini CLI ; lors de l’installation du hook, les commandes bash sont automatiquement et de façon transparente réécrites vers la commande équivalente de rtk
- Ce hook ne s’applique qu’aux appels d’outils Bash ; les outils intégrés de Claude Code comme
Read,Grep,Glob, etc. contournent ce mécanisme, donc pour appliquer le filtrage RTK il faut utiliser des commandes shell ou des commandes rtk explicites
- Ce hook ne s’applique qu’aux appels d’outils Bash ; les outils intégrés de Claude Code comme
- Pour une session Claude Code de 30 minutes, l’économie estimée est de ~23 900 tokens (environ 80 % de réduction) contre ~118 000 tokens en standard
- Jusqu’à 90 % de réduction avec des lanceurs de tests comme
cargo test/npm test,pytest,go test
- Jusqu’à 90 % de réduction avec des lanceurs de tests comme
- Prise en main
# 1. Installation rtk init -g # Claude Code / Copilot (par défaut) rtk init -g --gemini # Gemini CLI rtk init -g --codex # Codex (OpenAI) rtk init -g --agent cursor # Cursor # 2. Redémarrer ensuite l’outil IA git status # fonctionne désormais comme rtk git status - Licence Apache-2.0
9 commentaires
Au final, c’est un compromis avec la qualité, et je me demande aussi si cela ne risque pas de se transformer en une structure où l’on consomme davantage de tokens pour restaurer la qualité perdue.
Je l’ai déjà utilisé auparavant, mais je l’ai retiré parce que Claude finissait sans cesse par consommer encore plus de tokens pour résoudre les problèmes causés par rtk.
(Par exemple, quand on envoie une requête JSON avec
curl, il génère un JSON invalide,jqrenvoie une erreur, puis Claude se met à déboguer ça en y brûlant des tokens, et au final on en revient à refaire la requêtecurlbrute pour la parser avecjq.)Cela dit, je pense que l’intention en elle-même est bonne, donc ça pourrait valoir le coup de l’utiliser une fois qu’il sera stabilisé.
Je ne sais pas si ça réduit vraiment. J’ai beau dire à l’agent d’utiliser sans arrêt la commande
rtk ls.., il ne l’utilise pas.Personnellement, je l’utilise aussi… mais à cause de la compression de rtk, il arrive que Claude Code ne parvienne pas à récupérer dans le résultat des commandes le contexte dont il a besoin, donc j’ai l’impression que cela dépend des cas.
J’avais aussi trouvé ça dommage sur ce point-là !
Une mise à jour récente permet d’enregistrer la sortie complète dans un fichier séparé afin que le LLM puisse la lire si nécessaire~
Il semble y avoir quelques effets secondaires dans les cas d’usage d’autres utilisateurs.
J’espère que cela sera surmonté rapidement et bien appliqué.
https://reddit.com/r/ClaudeCode/…
S’il permet vraiment de bien les réduire, ce serait vraiment super !
Bonne idée.
Cela dit, comme l’entraînement a probablement été fait sur la base d’une sortie CLI classique, j’ai un léger doute sur le fait qu’en condensant ainsi, la sortie restera aussi bonne qu’avant.
Je vais l’essayer.
Il va falloir comparer avec contextmode...