30 points par GN⁺ 24 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Une astuce qui force les réponses en parler d’homme des cavernes pour réduire en moyenne de 65 à 75 % les tokens de sortie
  • Trois niveaux de compression, Lite · Full · Ultra, pour ajuster l’intensité tout en conservant la précision technique et en produisant des réponses courtes et efficaces
  • Dans des benchmarks réels, les explications liées à React, PostgreSQL et Git voient toutes leur consommation de tokens tomber à moins de la moitié
  • Offre en même temps une vitesse de réponse environ 3 fois supérieure, une meilleure lisibilité et une réduction des coûts
  • Installation possible par une commande simple sur Claude Code et Codex, avec un fonctionnement persistant sur toute la session

Présentation de Caveman

  • Un plugin pour Claude Code et Codex qui convertit les réponses du LLM en « parler d’homme des cavernes » (caveman-speak) afin de réduire l’usage des tokens d’environ 75 %
  • Produit des réponses courtes et efficaces en supprimant les mots inutiles tout en gardant la précision technique
  • L’installation se fait avec une commande sur une seule ligne et reste active dans toutes les sessions
  • Seuls les tokens de sortie sont réduits — aucun effet sur les tokens de réflexion/raisonnement
  • Éléments supprimés :
    • Salutations et introductions : "Sure, I'd be happy to help" (8 tokens gaspillés)
    • Débuts d’explication causale : "The reason this is happening is because" (7 tokens)
    • Formulations de recommandation : "I would recommend that you consider" (7 tokens)
    • Entrées superflues : "Sure, let me take a look at that for you" (10 tokens)
  • Éléments conservés : blocs de code, termes techniques (comme polymorphism), messages d’erreur, messages de commit git et de PR

Exemples Before / After

  • La même explication technique est compressée en phrases courtes
    • Explication des causes d’un rerender de composant React : 69 tokens → 19 tokens
    • Explication d’un bug de middleware d’authentification : plus de 75 % de réduction des tokens
  • Trois niveaux de compression réglables : Lite / Full / Ultra
    • Lite (/caveman lite) : supprime les formulations inutiles tout en gardant la grammaire — professionnel, sans verbiage
    • Full (/caveman full) : mode caveman par défaut — articles omis, phrases courtes et fragmentaires
    • Ultra (/caveman ultra) : compression maximale — style télégraphique, tout est abrégé

Benchmarks

  • La comparaison de l’usage réel des tokens via l’API Claude montre une réduction moyenne de 65 %
  • Plage de réduction : 22 % à 87 %
    • Explication d’un bug de rerender React : 1 180 → 159 tokens (87 % de réduction)
    • Configuration du pool de connexions PostgreSQL : 2 347 → 380 tokens (84 % de réduction)
    • Build multi-stage Docker : 1 042 → 290 tokens (72 % de réduction)
    • Explication de git rebase vs merge : 702 → 292 tokens (58 % de réduction)
    • Refactorisation callback → async/await : 387 → 301 tokens (22 % de réduction, effet minimal)
  • Seuls les tokens de sortie diminuent, les tokens de réflexion et de raisonnement restent inchangés
  • Les principaux bénéfices sont une meilleure lisibilité et une hausse de la vitesse de réponse ; la baisse des coûts est un effet secondaire

Fondement scientifique

  • L’article de mars 2026 "Brevity Constraints Reverse Performance Hierarchies in Language Models" montre qu’en imposant des réponses concises à de grands modèles, on obtient jusqu’à 26 points de pourcentage de gain de précision sur certains benchmarks, avec inversion du classement de performance
  • "Verbose not always better. Sometimes less word = more correct"
    • Une réponse courte peut parfois être plus juste qu’une réponse verbeuse

Installation

  • Installation en une ligne : npx skills add JuliusBrussee/caveman
  • Plugin Claude Code : claude plugin marketplace add JuliusBrussee/caveman
  • Codex : cloner le dépôt puis rechercher et installer Caveman dans le menu /plugins
  • Déclencheurs : /caveman, "talk like caveman", "caveman mode", "less tokens please"
  • Désactivation : "stop caveman" ou "normal mode"
  • Une seule installation → s’applique ensuite à toute la session

Utilisation

  • Commandes de déclenchement : /caveman, $caveman, “talk like caveman”, “caveman mode”, “less tokens please”

  • Commandes d’arrêt : “stop caveman”, “normal mode”

  • Réglage de l’intensité

    Level Trigger Caractéristiques
    Lite /caveman lite Grammaire conservée, suppression des mots inutiles
    Full /caveman full Mode par défaut, suppression des articles et du verbiage
    Ultra /caveman ultra Compression maximale, expression centrée sur les abréviations
  • Le réglage reste actif jusqu’à la fin de la session

  • Licence MIT / Python 100 % / prise en charge des plugins Claude Code & Codex

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.