- Les seuils doivent être définis en tenant compte des risques en production, du temps d’investigation/résolution et de la complexité
- Ils doivent être configurés avant qu’un risque ne se matérialise, afin de pouvoir agir rapidement
- Définir les seuils suffisamment loin du problème pour que l’opérateur ait le temps d’intervenir
- Mais il ne faut pas non plus définir les seuils trop loin du problème
- Certaines alertes ont plusieurs causes racines, ce qui les rend complexes à comprendre et à investiguer
- Pour aider à une résolution rapide, scinder les alertes selon le nombre de causes racines
- Il n’est pas facile de trouver le bon seuil, et cela demande plusieurs boucles de feedback courtes
Aucun commentaire pour le moment.