5 points par ironlung 2024-05-28 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Les seuils doivent être définis en tenant compte des risques en production, du temps d’investigation/résolution et de la complexité
  • Ils doivent être configurés avant qu’un risque ne se matérialise, afin de pouvoir agir rapidement
  • Définir les seuils suffisamment loin du problème pour que l’opérateur ait le temps d’intervenir
  • Mais il ne faut pas non plus définir les seuils trop loin du problème
  • Certaines alertes ont plusieurs causes racines, ce qui les rend complexes à comprendre et à investiguer
  • Pour aider à une résolution rapide, scinder les alertes selon le nombre de causes racines
  • Il n’est pas facile de trouver le bon seuil, et cela demande plusieurs boucles de feedback courtes

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.