Recueil de post-mortems
(github.com)Apprendre à partir d’articles d’analyse sur la résolution d’incidents par des entreprises IT (environ 150+)
-
Erreurs de configuration de routeurs/LB/cloud : Google, Travis CI et bien d’autres
-
Erreurs matérielles/d’alimentation : cloud et centres de données d’Amazon, Google, etc.
-
Divers problèmes de conflits : GitHub, Google
-
Problèmes liés au temps, comme les dates de certificats ou les secondes intercalaires
-
Et autres
→ Diverses erreurs humaines
→ Problèmes provoqués par une seule ligne de code, de mauvais logs, etc.
→ DDoS
→ Problèmes de gestion des autorisations
- Comprend aussi de nombreux liens vers d’autres recueils de post-mortems
Aucun commentaire pour le moment.