12 points par GN⁺ 2025-06-21 | 2 commentaires | Partager sur WhatsApp
  • Outil de surveillance affichant en temps réel dans le terminal diverses informations comme l’utilisation des tokens Claude AI, la vitesse d’épuisement et les prévisions de consommation
  • Barre de progression colorée mise à jour toutes les 3 secondes, avec prévision intelligente de l’épuisement des tokens
  • En cas de dépassement de la limite du plan de base, analyse l’historique des sessions pour basculer immédiatement sur la limite réelle
  • Détecte et prend automatiquement en charge les plans d’usage Pro/Max5/Max20/custom_max
  • Alertes en temps réel à l’approche ou au dépassement de la limite de tokens par session, ainsi qu’en cas de risque d’épuisement avant la réinitialisation de la session
  • Interface conçue pour s’adapter au flux d’utilisation réel de Claude
  • Installation via npm, pip, utilisation recommandée d’un environnement virtuel (venv/virtualenv), compatible Mac/Linux/Windows

Comprendre les sessions Claude

  • Fonctionnement en fenêtre glissante de 5 heures
    • Une session reste active pendant 5 heures à partir de l’envoi du premier message
    • Les limites s’appliquent par session, et plusieurs sessions peuvent être actives en parallèle
    • La réinitialisation réelle se produit toutes les 5 heures sur la base de mes messages
  • Il est possible de définir l’heure de réinitialisation des sessions/tokens selon son propre planning

Scénarios d’utilisation

  • Développeur du matin / arrivée au bureau : possibilité d’ajuster le planning de réinitialisation des tokens sur l’heure de début de journée (par ex. 9 h) pour mieux planifier
  • Travail de nuit : utiliser une réinitialisation des tokens calée sur son emploi du temps, par exemple à minuit
  • Utilisateur avec limite variable : le mode custom_max détecte automatiquement la limite adaptée à l’environnement réel
  • Développeurs globaux / à distance : déplacements entre plusieurs fuseaux horaires, définition d’une heure de réinitialisation à l’échelle de l’équipe → optimisation de la collaboration
  • Vérification rapide de l’état : simple exécution, quelle que soit la configuration

Bonnes pratiques de configuration de l’environnement

  • Commencer la surveillance dès le démarrage de la session
    • Lancer immédiatement le moniteur au début du travail avec Claude (./ccusage_monitor.py)
    • Plans pris en charge
      • pro : environ 7 000 tokens (tests et usage léger)
      • max5 : environ 35 000 tokens (développement quotidien)
      • max20 : environ 140 000 tokens (grands projets et usage moyen/intensif)
      • custom_max : mode de détection automatique (utilise la valeur maximale selon l’historique réel)
    • Meilleure précision du suivi des tokens sur l’ensemble de la session
    • Permet de calculer la vitesse de consommation et d’anticiper les alertes de limite proche
  • Utiliser un environnement virtuel Python (venv)
    • Évite les conflits de dépendances, isole l’environnement et garantit la reproductibilité par projet
    • Installation et exécution :
      python3 -m venv venv  
      source venv/bin/activate  
      pip install pytz  
      
    • Pour supprimer proprement l’installation, il suffit d’effacer le dossier de l’environnement virtuel
  • Définir un alias shell personnalisé
    • Raccourcit les commandes répétitives en une seule ligne
      alias claude-monitor='cd ~/Claude-Code-Usage-Monitor && source venv/bin/activate && ./ccusage_monitor.py'  
      
    • Ajoutez-le à .bashrc ou .zshrc pour lancer directement le moniteur en une seule commande

Bonnes pratiques d’utilisation

  • Surveiller en permanence le Burn Rate (vitesse de consommation)
    • Soyez attentif si l’utilisation des tokens grimpe soudainement
    • Ajustez l’intensité du travail selon le temps et le volume de tokens restants
    • Planifiez les gros travaux, comme un refactoring massif, avant ou après la réinitialisation de session (remise à zéro des tokens)
  • Planification stratégique des sessions
    • Commencez les gros travaux juste après la réinitialisation des tokens, et réservez les tâches légères aux moments où la limite approche
      ./ccusage_monitor.py --reset-hour 9  
      
    • La règle des 5 heures par session permet d’exploiter plusieurs sessions qui se chevauchent
  • Spécifier clairement le fuseau horaire
    • Reflète le fuseau réel de travail/collaboration pour une prévision précise de la réinitialisation des tokens et une meilleure gestion du planning
      ./ccusage_monitor.py --timezone Asia/Seoul  
      
    • Réduit les erreurs d’horaire et les confusions sur l’expiration des sessions lors d’une collaboration internationale

Conseils d’optimisation

  • Configuration du terminal
    • Terminal d’au moins 80 caractères de large recommandé
    • La prise en charge des couleurs améliore fortement le retour visuel
    • Surveillance continue recommandée dans une fenêtre dédiée
  • Intégration au workflow
    • Utilisez un multiplexeur de terminal comme tmux pour surveiller en parallèle du développement
      tmux new-session -d -s claude-monitor './ccusage_monitor.py'  
      tmux attach -t claude-monitor  
      
  • Stratégie multi-sessions
    • Chaque session reste fixée à 5 heures, avec possibilité de gérer plusieurs sessions qui se chevauchent
    • Répartissez les longues tâches entre plusieurs sessions, en restant attentif aux limites et aux expirations de chacune

Exemples de workflow réel

  • Développement sur un grand projet
    ./ccusage_monitor.py --plan max20 --reset-hour 8 --timezone America/New_York  
    
    • Réinitialisation des tokens à 8 h → début du développement des fonctionnalités principales
    • Vérification du Burn Rate à 10 h puis ajustement du rythme de travail
    • Point et ajustement du planning de l’après-midi à 12 h
    • Ouverture d’une nouvelle session à 14 h pour traiter des problèmes complexes
    • Tâches légères à 16 h / préparation de la session du soir
  • Usage orienté apprentissage / expérimentation
    ./ccusage_monitor.py --plan pro  
    
    • Adapté à l’apprentissage léger et à l’écriture de code expérimental
  • Développement intensif en mode sprint
    ./ccusage_monitor.py --plan max20 --reset-hour 6  
    
    • Configuration adaptée à un développement avec forte consommation de tokens attendue

2 commentaires

 
fanotify 2025-06-21

C’est la même chose : https://fr.news.hada.io/topic?id=21560

 
GN⁺ 2025-06-21
Avis Hacker News
  • Je trouve frustrant le manque de transparence de Claude, et j’aime beaucoup cette idée. L’une des fonctions clés de Claude Code est de mieux gérer le contexte et les limites que l’application desktop (par ex. mode compact, affichage du % de capacité restante), mais j’ai quand même l’impression que ce n’est pas encore suffisant. Autre remarque : à titre personnel, je trouve qu’utiliser trop d’emojis dans le README d’un projet donne une impression très peu professionnelle, comme si le projet avait été codé par IA « à l’ambiance » sans vraie supervision.

    • Quand je suis entré dans le logiciel, si on se faisait attraper à mettre des emojis dans une codebase, c’était quasiment motif d’internement. Aujourd’hui, l’époque a complètement changé, et j’utilise souvent les emojis pour structurer visuellement le contexte. Maintenant, mon code contient assez d’emojis pour me rendre heureux.

    • On voit beaucoup ce style à base d’emojis dans les startups récentes ou les boîtes plus jeunes. C’est probablement en grande partie l’influence de Notion. Dans notre entreprise, on choisit toujours un emoji, que ce soit pour une liste, une page ou même une invitation calendrier.

    • Je trouve assez ironique qu’on poste ce genre de commentaire à propos d’un logiciel conçu pour le codage avec l’IA.

    • Quand on regarde le code en pratique, il s’agit juste d’un fichier Python de 400 lignes qui encapsule simplement ccusage. Donc je peux comprendre pourquoi ça donne cette impression.

    • Pour les descriptions de PR ou les README générés par IA, j’ajoute toujours dans le prompt une consigne du type « sois concis, sans tournures tape-à-l’œil ni emojis ». Comme ça, la fête aux emojis un peu dispersée se transforme en documentation correcte. Cela dit, ça peut varier selon le contexte.

  • Je suis le créateur de ccusage, et je suis heureux de voir les gens utiliser notre open source de toutes sortes de façons. Happy vibe coding!

    • Ce qui est amusant, c’est que le Show HN de ccusage n’a eu absolument aucun commentaire, alors que ce fil est très actif. Lien vers le fil associé
  • À titre indicatif, ma limite maximale de tokens sur une session passée était d’environ 337 492, et j’utilise le plan Max20 et Opus à environ 99 %. J’utilise Claude Code depuis le 27 mai, pour un total de 1 374 439 311 tokens consommés, soit environ 3 397 dollars.

    • Avec le plan Max20, j’en ai utilisé pour environ 2 100 dollars. Je me demande s’ils dégagent une marge énorme sur l’API, ou s’ils vendent à perte. Je l’utilise tous les jours, mais je n’ai pas l’impression d’en abuser.

    • Est-ce que tu te heurtes souvent à la limitation de débit sur Opus, et est-ce que tu le trouves plus lent que Sonnet ?

  • J’arrive à sentir intuitivement à quel point les tokens utilisés sont proches de la limite. Je sens aussi quand une conversation elle-même approche du maximum ; à ce moment-là, j’utilise les dernières ressources restantes pour générer un résumé, puis je poursuis le travail dans une nouvelle conversation. J’ai l’impression que ces outils d’IA font désormais partie de mon horloge biologique. Chaque mercredi, la limite hebdomadaire de ChatGPT est réinitialisée, donc le mercredi ressemble à un nouveau dimanche.

  • J’ai observé que l’utilisation des tokens ne se réinitialise pas si elle n’a pas atteint 100 % une fois la fenêtre temporelle écoulée. Par exemple, on peut en avoir utilisé 90 %, passer à la fenêtre suivante, puis épuiser rapidement les 10 % restants et devoir ensuite attendre longtemps.

  • J’ai créé un outil UI (crystal) qui permet d’utiliser plusieurs sessions Claude Code en parallèle. Comme je travaille sur plusieurs choses à la fois, j’atteins souvent les limites de mon compte. En général, j’atteins la limite près de l’heure de réinitialisation, mais ce serait encore mieux de pouvoir savoir à l’avance quand faire une pause.

    • J’utilise énormément Claude Code, mais je n’ose pas me faire mon propre tooling pour les worktrees et les sessions multiples, parce que je ne maîtrise pas assez git. Pour être honnête, ce genre d’outil me fait un peu peur aussi ; dans l’idéal, j’aimerais faire tourner chaque worktree dans un conteneur, mais j’ai l’impression qu’il serait difficile d’obtenir quelque chose d’aussi fluide que Crystal.

    • J’aime bien cet outil, mais Crystal est déjà le nom d’un langage de programmation que j’ai utilisé il y a longtemps, donc c’est un peu confus.

    • Si tu ouvres une issue sur GitHub (ici), je peux aussi essayer une intégration avec mon usage monitor.

    • Impressionnant. J’ai presque eu envie de demander à Claude de me faire un outil comme ça, non pas par projet mais pour 5 projets simultanés. Je vois plein de cas d’usage.

  • C’est vraiment intéressant, mais je me demande si la limite de tokens du plan Pro n’est vraiment que de 7 000. Autrement dit, ça ferait même pas 7 000 mots, alors qu’en pratique j’ai l’impression de pouvoir utiliser bien davantage. À ce niveau-là, on aurait l’impression qu’une conversation un peu longue suffirait à atteindre rapidement la limite, pourtant ça ne m’est encore jamais arrivé. Je me demande si c’est une limite propre à Claude Code ; je n’ai pas encore beaucoup utilisé Claude Code, donc je ne sais pas trop.

    • Le plan Pro coûte 20 $ par mois. L’accès à claude code est devenu possible récemment. Mais j’ai entendu dire que certains utilisateurs atteignent la limite après seulement quelques requêtes. Du coup, ce chiffre me semble plausible. Les limites de l’interface de chat et celles de Claude Code sont distinctes.
  • C’est excellent, merci d’avoir fait ça. On peut l’installer avec uv ? Partage d’un lien vers uv et d’un exemple de commandes shell récapitulant l’installation ligne par ligne.

    • Si ce dépôt avait été structuré comme un paquet avec project.toml et autres, on aurait pu l’installer plus rapidement avec pipx (pipx) comme ceci :

pipx install git+https://github.com/Maciek-roboblog/Claude-Code-Usage-Monitor ccusage_monitor uv a probablement une commande similaire (uvx), mais je ne sais pas si c’est exactement la même chose en termes de fonction ou d’objectif que pipx.

  • À noter que presque tout ce qui peut être installé avec pip peut aussi l’être avec uv, donc c’est également plus simple avec uv.

  • Je me demande si cet outil apporte autre chose d’utile que d’exécuter ccusage via un appel shell. Honnêtement, ce genre de projet est un peu décevant, et donne l’impression d’avoir été bouclé d’un coup avec un outil d’IA. Dans le Show HN, c’est dommage qu’il ne soit même pas mentionné que tout le vrai travail est effectué par un autre outil.

  • J’ai eu une expérience étrange avec Claude Code hier. Il a échoué à convertir une vieille page de tableau phtml écrite en PHP vers une nouvelle mise en page en div, et ça m’a coûté environ 4 dollars. C’est peut-être un problème lié à WSL, mais j’espère que ce genre de chose n’arrive pas trop souvent.

    • Claude Code a une vraie courbe d’apprentissage. Il faut mener de longues sessions de discussion, bien cadrer les exigences et amener le modèle à formuler des questions claires. Même ainsi, ce type d’échec peut parfois se produire, donc il faut bien garder à l’esprit que c’est un outil très coûteux. Ce n’est pas magique, contrairement à ce que racontent certains youtubeurs ou blogueurs.