- L’entreprise de jeux Roblox a subi une panne complète de l’ensemble de son système en octobre 2021
- Ce problème a commencé modestement à cause d’un incident affectant un composant dans un centre de données
- Le problème s’est rapidement propagé, entraînant une interruption du système pendant 73 heures
- Depuis, Roblox s’efforce de renforcer la résilience de son infrastructure face aux types de pannes qui peuvent toucher tout système à grande échelle, en raison de facteurs tels que des pics de trafic extrêmes, la météo, des pannes matérielles, des bugs logiciels ou des erreurs humaines
- Roblox s’est demandé : « Lorsque ce type de panne se produit, comment pouvons-nous empêcher qu’un problème touchant un composant unique ou un groupe de composants ne se propage à l’ensemble du système ? »
- L’entreprise a travaillé à résoudre ce problème et, au premier semestre 2023, a économisé 125 millions d’heures d’engagement par mois par rapport à la même période de l’année précédente
Aucun commentaire pour le moment.