- Outil de supervision basé sur l’IA visant à automatiser la réponse aux incidents dans un environnement Kubernetes
- Utilise Claude Code pour analyser en temps réel l’état des Pods, détecter les erreurs et appliquer automatiquement des correctifs ou générer des rapports
- S’exécute périodiquement sous forme de CronJob, afin de maintenir un système de réponse autonome 24 h/24 même en l’absence d’opérateur
- Fonctionnement principal
- Surveillance de l’état des Pods dans le Namespace cible
- Détection des états anormaux comme CrashLoopBackOff, Error, etc.
- Identification de la cause des erreurs via l’analyse des logs
- Si nécessaire, entrée à l’intérieur du Pod pour appliquer un hotfix
- Enregistrement des modifications dans une base SQLite et génération de rapports
- Une configuration de déploiement Dashboard séparée permet la visualisation des erreurs et de l’historique des corrections dans une interface web
- Structure légère composée de Go + HTML + Shell, optimisée pour un déploiement Kubernetes CronJob
- Licence MIT
Aucun commentaire pour le moment.