Caveman - économiser les tokens Claude/Codex avec un parler d’homme des cavernes
(github.com/JuliusBrussee)- Une astuce qui force les réponses en parler d’homme des cavernes pour réduire en moyenne de 65 à 75 % les tokens de sortie
- Trois niveaux de compression, Lite · Full · Ultra, pour ajuster l’intensité tout en conservant la précision technique et en produisant des réponses courtes et efficaces
- Dans des benchmarks réels, les explications liées à React, PostgreSQL et Git voient toutes leur consommation de tokens tomber à moins de la moitié
- Offre en même temps une vitesse de réponse environ 3 fois supérieure, une meilleure lisibilité et une réduction des coûts
- Installation possible par une commande simple sur Claude Code et Codex, avec un fonctionnement persistant sur toute la session
Présentation de Caveman
- Un plugin pour Claude Code et Codex qui convertit les réponses du LLM en « parler d’homme des cavernes » (
caveman-speak) afin de réduire l’usage des tokens d’environ 75 % - Produit des réponses courtes et efficaces en supprimant les mots inutiles tout en gardant la précision technique
- L’installation se fait avec une commande sur une seule ligne et reste active dans toutes les sessions
- Seuls les tokens de sortie sont réduits — aucun effet sur les tokens de réflexion/raisonnement
- Éléments supprimés :
- Salutations et introductions : "Sure, I'd be happy to help" (8 tokens gaspillés)
- Débuts d’explication causale : "The reason this is happening is because" (7 tokens)
- Formulations de recommandation : "I would recommend that you consider" (7 tokens)
- Entrées superflues : "Sure, let me take a look at that for you" (10 tokens)
- Éléments conservés : blocs de code, termes techniques (comme polymorphism), messages d’erreur, messages de commit git et de PR
Exemples Before / After
- La même explication technique est compressée en phrases courtes
- Explication des causes d’un rerender de composant React : 69 tokens → 19 tokens
- Explication d’un bug de middleware d’authentification : plus de 75 % de réduction des tokens
- Trois niveaux de compression réglables : Lite / Full / Ultra
- Lite (
/caveman lite) : supprime les formulations inutiles tout en gardant la grammaire — professionnel, sans verbiage - Full (
/caveman full) : mode caveman par défaut — articles omis, phrases courtes et fragmentaires - Ultra (
/caveman ultra) : compression maximale — style télégraphique, tout est abrégé
- Lite (
Benchmarks
- La comparaison de l’usage réel des tokens via l’API Claude montre une réduction moyenne de 65 %
- Plage de réduction : 22 % à 87 %
- Explication d’un bug de rerender React : 1 180 → 159 tokens (87 % de réduction)
- Configuration du pool de connexions PostgreSQL : 2 347 → 380 tokens (84 % de réduction)
- Build multi-stage Docker : 1 042 → 290 tokens (72 % de réduction)
- Explication de git rebase vs merge : 702 → 292 tokens (58 % de réduction)
- Refactorisation callback → async/await : 387 → 301 tokens (22 % de réduction, effet minimal)
- Seuls les tokens de sortie diminuent, les tokens de réflexion et de raisonnement restent inchangés
- Les principaux bénéfices sont une meilleure lisibilité et une hausse de la vitesse de réponse ; la baisse des coûts est un effet secondaire
Fondement scientifique
- L’article de mars 2026 "Brevity Constraints Reverse Performance Hierarchies in Language Models" montre qu’en imposant des réponses concises à de grands modèles, on obtient jusqu’à 26 points de pourcentage de gain de précision sur certains benchmarks, avec inversion du classement de performance
- "Verbose not always better. Sometimes less word = more correct"
- Une réponse courte peut parfois être plus juste qu’une réponse verbeuse
Installation
- Installation en une ligne :
npx skills add JuliusBrussee/caveman - Plugin Claude Code :
claude plugin marketplace add JuliusBrussee/caveman - Codex : cloner le dépôt puis rechercher et installer Caveman dans le menu
/plugins - Déclencheurs :
/caveman, "talk like caveman", "caveman mode", "less tokens please" - Désactivation : "stop caveman" ou "normal mode"
- Une seule installation → s’applique ensuite à toute la session
Utilisation
-
Commandes de déclenchement :
/caveman,$caveman, “talk like caveman”, “caveman mode”, “less tokens please” -
Commandes d’arrêt : “stop caveman”, “normal mode”
-
Réglage de l’intensité
Level Trigger Caractéristiques Lite /caveman liteGrammaire conservée, suppression des mots inutiles Full /caveman fullMode par défaut, suppression des articles et du verbiage Ultra /caveman ultraCompression maximale, expression centrée sur les abréviations -
Le réglage reste actif jusqu’à la fin de la session
-
Licence MIT / Python 100 % / prise en charge des plugins Claude Code & Codex
Aucun commentaire pour le moment.