Caveman - économiser les tokens Claude/Codex avec un parler d’homme des cavernes

(github.com/JuliusBrussee)

30 points par GN⁺ 24 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Une astuce qui force les réponses en parler d’homme des cavernes pour réduire en moyenne de 65 à 75 % les tokens de sortie
Trois niveaux de compression, Lite · Full · Ultra, pour ajuster l’intensité tout en conservant la précision technique et en produisant des réponses courtes et efficaces
Dans des benchmarks réels, les explications liées à React, PostgreSQL et Git voient toutes leur consommation de tokens tomber à moins de la moitié
Offre en même temps une vitesse de réponse environ 3 fois supérieure, une meilleure lisibilité et une réduction des coûts
Installation possible par une commande simple sur Claude Code et Codex, avec un fonctionnement persistant sur toute la session

Présentation de Caveman

Un plugin pour Claude Code et Codex qui convertit les réponses du LLM en « parler d’homme des cavernes » (caveman-speak) afin de réduire l’usage des tokens d’environ 75 %
Produit des réponses courtes et efficaces en supprimant les mots inutiles tout en gardant la précision technique
L’installation se fait avec une commande sur une seule ligne et reste active dans toutes les sessions
Seuls les tokens de sortie sont réduits — aucun effet sur les tokens de réflexion/raisonnement
Éléments supprimés :
- Salutations et introductions : "Sure, I'd be happy to help" (8 tokens gaspillés)
- Débuts d’explication causale : "The reason this is happening is because" (7 tokens)
- Formulations de recommandation : "I would recommend that you consider" (7 tokens)
- Entrées superflues : "Sure, let me take a look at that for you" (10 tokens)
Éléments conservés : blocs de code, termes techniques (comme polymorphism), messages d’erreur, messages de commit git et de PR

La même explication technique est compressée en phrases courtes
- Explication des causes d’un rerender de composant React : 69 tokens → 19 tokens
- Explication d’un bug de middleware d’authentification : plus de 75 % de réduction des tokens
Trois niveaux de compression réglables : Lite / Full / Ultra
- Lite (/caveman lite) : supprime les formulations inutiles tout en gardant la grammaire — professionnel, sans verbiage
- Full (/caveman full) : mode caveman par défaut — articles omis, phrases courtes et fragmentaires
- Ultra (/caveman ultra) : compression maximale — style télégraphique, tout est abrégé

La comparaison de l’usage réel des tokens via l’API Claude montre une réduction moyenne de 65 %
Plage de réduction : 22 % à 87 %
- Explication d’un bug de rerender React : 1 180 → 159 tokens (87 % de réduction)
- Configuration du pool de connexions PostgreSQL : 2 347 → 380 tokens (84 % de réduction)
- Build multi-stage Docker : 1 042 → 290 tokens (72 % de réduction)
- Explication de git rebase vs merge : 702 → 292 tokens (58 % de réduction)
- Refactorisation callback → async/await : 387 → 301 tokens (22 % de réduction, effet minimal)
Seuls les tokens de sortie diminuent, les tokens de réflexion et de raisonnement restent inchangés
Les principaux bénéfices sont une meilleure lisibilité et une hausse de la vitesse de réponse ; la baisse des coûts est un effet secondaire

L’article de mars 2026 "Brevity Constraints Reverse Performance Hierarchies in Language Models" montre qu’en imposant des réponses concises à de grands modèles, on obtient jusqu’à 26 points de pourcentage de gain de précision sur certains benchmarks, avec inversion du classement de performance
"Verbose not always better. Sometimes less word = more correct"
- Une réponse courte peut parfois être plus juste qu’une réponse verbeuse

Installation en une ligne : npx skills add JuliusBrussee/caveman
Plugin Claude Code : claude plugin marketplace add JuliusBrussee/caveman
Codex : cloner le dépôt puis rechercher et installer Caveman dans le menu /plugins
Déclencheurs : /caveman, "talk like caveman", "caveman mode", "less tokens please"
Désactivation : "stop caveman" ou "normal mode"
Une seule installation → s’applique ensuite à toute la session

Commandes de déclenchement : /caveman, $caveman, “talk like caveman”, “caveman mode”, “less tokens please”
Commandes d’arrêt : “stop caveman”, “normal mode”

Réglage de l’intensité

Level	Trigger	Caractéristiques
Lite	`/caveman lite`	Grammaire conservée, suppression des mots inutiles
Full	`/caveman full`	Mode par défaut, suppression des articles et du verbiage
Ultra	`/caveman ultra`	Compression maximale, expression centrée sur les abréviations