Existe-t-il des outils pour surveiller et journaliser le fonctionnement de l’IA ?

4 points par qnfw3175 2026-05-18 | 10 commentaires | Partager sur WhatsApp

Existe-t-il des outils ou des projets, en local ou avec une interface Web UI, qui permettent de journaliser lors de l’utilisation d’une IA les entrées et sorties, ainsi que le fonctionnement du processus (recherche Web, autorisations d’exécution, exécution, etc.), bref toutes les actions visibles au niveau du système ?

Même partiellement, cela m’intéresse. Qu’il s’agisse d’un service commercial, par exemple.
Dans le cas de Claude Code, par exemple, on lance Claude depuis le terminal avec claude, puis on obtient ensuite une journalisation des entrées et sorties, ainsi que des tâches exécutées par le processus Claude pendant son fonctionnement (réseau, actions locales, etc.)...

10 commentaires

waterbear 15 일 전

Je ne sais pas si c’est exactement ce que vous cherchez, mais pour le suivi des modèles, il existe un projet open source appelé https://langfuse.com/.

pointless 26 일 전

Je ne sais pas si j’ai le droit de laisser un commentaire sur ce que j’ai créé, mais je me dis que cela pourrait vous aider si c’est le type d’outil que vous recherchez. (Si c’est interdit, je m’en excuse.)
Ce n’est pas pour journaliser absolument toutes les actions d’une IA, mais je développe un service qui enregistre ce qui a été consulté pour produire telle ou telle réponse. Nous avons pivoté depuis un simple semantic hub. Sur une base de Merkle tree, nous inscrivons des hash dans un registre externe et appliquons un witness via Rekor afin d’empêcher toute falsification ou altération.
S’il s’agit d’un modèle non-LLM avec un petit nombre de paramètres, il est aussi possible d’appliquer zkML pour vérifier la cohérence entre l’entrée et la réponse produite.
Si vous collez la démo de journal d’audit ci-dessous dans le vérificateur de preuve de logs situé en bas de la page d’accueil, vous pourrez voir ce qu’il est possible de vérifier.
Page : https://hub.rawctx.dev/
Démo de journal d’audit : https://github.com/pasar6987-create/rawctx-demo-audit-log/…

byun1114 2026-05-18

Quand on pose la question elle-même à Gemini, quelques options ressortent. Avez-vous essayé de chercher de cette façon ?

syate 21 일 전

C’est peut-être hors sujet, mais j’ai l’impression que ce genre de commentaire a un effet négatif sur l’ambiance de la communauté.
Ce serait bien qu’on puisse poser librement ses questions quand on a une interrogation,
et les remarques du genre « à vous de chercher »,, encore plus quand beaucoup de gens sont déjà lassés par le contenu IA de mauvaise qualité, alors suggérer de se reposer sur des réponses de LLM l’est d’autant moins..

cgl00 2026-05-20

On peut vouloir entendre les réponses des membres de la communauté plutôt que celles de Gemini. Je pense que c’est une question légitime.

zihado 2026-05-21

Je l’ai mis en place avec clickstack. En configurant otel pour lui envoyer les données.

woung717 2026-05-19

N’est-ce pas les fonctionnalités proposées par le proxy LiteLLM et par LangSmith ?

junoverse 2026-05-19

Argos, ou Cursor Mafia ? Il existe un service géré par quelqu’un qui fait du vibe coding et qui vient de l’équipe de développement de Toss ; l’auto-hébergement est aussi possible, et on peut surveiller plusieurs comptes via des clés API ou selon le plan, avec apparemment des fonctionnalités comme voir combien de sessions ont tourné, quels outils ont été utilisés, etc.

Je ne me souviens plus très bien si ça ne marchait qu’avec Claude, mais si vous comptez en créer un sur mesure, ça peut valoir le coup d’aller regarder comment c’est fait.

taekim34 2026-05-19

Si vous êtes plutôt du côté de Claude Code, essayez donc cc-token-saver (https://github.com/ww-w-ai/cc-token-saver).

Claude Code enregistre pour chaque session, dans un transcript (.jsonl), toutes les entrées/sorties ainsi que les appels d’outils (lecture/écriture de fichiers, exécution de bash, requêtes web, etc.), et cc-token-saver analyse ces données pour visualiser dans un tableau de bord HTML ce qui a été fait par session et où, ainsi que combien de tokens ont été consommés. Vous pouvez voir d’un coup d’œil « quels fichiers l’IA a touchés dans cette session, combien de fois elle a exécuté des commandes et combien cela a coûté ».

En particulier, la fonctionnalité /continue sert à restaurer des sessions existantes en analysant le transcript, et comme cette capacité d’analyse du transcript peut être utilisée telle quelle, vous pouvez aussi lui donner une consigne du type : « analyse les entrées, les sorties et les informations réseau pour le cas où /continue ~ ». (Le LLM adaptera et appliquera cela de lui-même de manière appropriée)

darjeeling 2026-05-19

Pas seulement pour l’IA : vous pouvez utiliser strace ou divers outils de débogage.
Si vous voulez créer quelque chose d’aussi abouti qu’un service, regardez du côté des outils basés sur eBPF.

Existe-t-il des outils pour surveiller et journaliser le fonctionnement de l’IA ?

À lire aussi

10 commentaires