2 points par GN⁺ 2025-01-15 | 1 commentaires | Partager sur WhatsApp
  • Entre le 13 janvier 2025 à 23:35 UTC et 00:24 UTC, une panne a rendu toutes les opérations Git indisponibles sur GitHub
  • La cause était un changement de configuration ; un load balancer interne a commencé à abandonner les requêtes entre les services dont Git dépend, provoquant l’incident
  • GitHub a atténué l’incident en revenant en arrière sur la configuration en cause
  • Le périmètre le plus touché a été celui des opérations Git, tandis qu’Actions et Pages ont aussi subi une dégradation des performances
  • Des améliorations des pratiques de monitoring et de déploiement sont en cours afin d’accélérer la détection et l’atténuation automatique d’incidents similaires

Aperçu de l’incident

  • Du 13 janvier 2025 à 23:35 UTC au 14 janvier à 00:24 UTC, toutes les opérations Git étaient indisponibles
  • Après un changement de configuration, un load balancer interne a commencé à abandonner les requêtes entre les services dont Git dépend
  • GitHub a atténué l’incident en revenant en arrière sur ce changement de configuration
  • Les composants affectés étaient Git Operations, Actions et Pages

Chronologie

  • 23:44 UTC : début de l’enquête sur une baisse de disponibilité de Git Operations
  • 23:46 UTC : une dégradation des performances est apparue sur Pages, et l’enquête s’est poursuivie
  • 23:57 UTC : une dégradation des performances a également été confirmée sur Actions
  • 00:15 UTC : la cause de la dégradation des performances des opérations Git a été identifiée, et GitHub a estimé qu’elle pouvait aussi affecter d’autres services dépendant de Git
  • 00:28 UTC : l’incident est passé à l’état Resolved, et GitHub améliore son monitoring et ses pratiques de déploiement afin de réduire les délais de détection et d’atténuation automatique

1 commentaires

 
toughrogrammer 2025-01-17

Les pannes de Github sont vraiment trop fréquentes…