25 points par tenshi 2022-02-03 | 5 commentaires | Partager sur WhatsApp

Il s’agit d’un article de post-mortem sur l’incident survenu sur le service Inflearn, qui a empêché l’utilisation continue du service du 3 au 17 janvier 2022. Il traite en détail du processus allant de la détection de l’incident à la réponse initiale, sa réapparition, l’analyse de la cause racine, puis la résolution de cette cause racine.

5 commentaires

 
xor100 2022-02-03

Merci pour ce bon article. En revanche, il existe un bon terme comme « rétrospective »… pourquoi avoir utilisé le mot « autopsie » ? Ce n’est pas faux, mais cela donne une impression un peu négative.

 
kbumsik 2022-02-04

Pour traduire postmortem, on utilise souvent le mot « autopsie » pour désigner les mesures prises après un incident.

 
ffdd270 2022-02-04

Comme le service était « mort » (...), j’ai trouvé amusante la nuance d’« autopsie ». Mais on peut aussi le ressentir différemment. « m »

 
budlebee 2022-02-03

Je pense qu’il s’agit d’une nuance proche d’un e-mail de postmortem à la Netflix.

 
tenshi 2022-02-03

En particulier, dans le cas de la table des cours, chaque Dead Tuple occupe un volume très important en raison de colonnes de grande taille (le code HTML de la colonne de présentation du cours).

Par conséquent, des requêtes de mise à jour fréquentes entraînent la production en masse de Dead Tuples volumineux.

En particulier, la partie d’analyse des causes profondes qui permet de mesurer concrètement l’impact des Dead Tuples de PostgreSQL sur le service semble constituer une très bonne référence.