1 points par GN⁺ 2024-07-30 | 1 commentaires | Partager sur WhatsApp

L’impact de CrowdStrike sur le secteur aérien

  • Le 19 juillet 2024, CrowdStrike a déployé une mise à jour de configuration de capteur sur des systèmes Windows
  • Cette mise à jour a provoqué des écrans bleus sur environ 8,5 millions d’ordinateurs, affectant divers organismes comme des hôpitaux, des banques et les systèmes d’appel d’urgence 911
  • Linux, Mac et les téléphones mobiles n’ont pas été affectés

Impact sur le secteur aérien américain

  • Présentation d’un graphique comparant, heure par heure, le nombre d’avions ayant décollé aux États-Unis le 19 juillet
  • Par rapport au 12 juillet, légère baisse de 06h00 à 13h00, puis légère hausse ensuite
  • Dans les statistiques cumulées à partir de 04h00, hausse de 2,6 % par rapport au vendredi de la semaine précédente

Statistiques des compagnies aériennes

  • Présentation des statistiques des quatre principales compagnies aériennes américaines (Delta, United, American, Southwest)
  • Delta : -1087 vols (-46 %)
  • United : -596 vols (-36 %)
  • American : -376 vols (-16 %)
  • Southwest : +101 vols (+3 %)

Résumé par compagnie

  • Delta a été la plus durement touchée, suivie par United et American
  • Southwest n’a pas été affectée
  • Delta a mis longtemps à se rétablir, tandis que les autres compagnies sont revenues à la normale plus rapidement

Données et analyse

  • Traitement des données brutes d’ADS-B Exchange à l’aide d’un code détectant les décollages d’avions
  • Les décollages ont été considérés comme des vols pour établir les statistiques

Résumé de GN⁺

  • Cet article analyse l’impact de la panne informatique massive provoquée par la mise à jour de CrowdStrike sur le secteur aérien
  • Différents avis sont avancés pour expliquer pourquoi la compagnie Delta a mis plus de temps que les autres à se rétablir
  • L’article souligne l’importance de la stabilité des systèmes informatiques et des plans d’urgence
  • Parmi les projets offrant des fonctions similaires, des outils de gestion et d’analyse de logs comme Splunk sont recommandés

1 commentaires

 
GN⁺ 2024-07-30
Avis Hacker News
  • Le logiciel de suivi des équipages de Delta a été durement touché, et la reprise a pris du temps

  • Cela suggère que beaucoup d’ordinateurs ne devraient pas être connectés à Internet

  • Delta semble déjà préparer une action en justice

  • Article indiquant que Southwest Airlines a évité la panne de CrowdStrike et Microsoft en utilisant Windows 3.1

  • S’interroge sur la raison pour laquelle l’aéroport Minneapolis-St Paul a connu des annulations plus tôt que les autres aéroports américains

  • S’interroge sur l’efficacité de plans de reprise après sinistre récents et bien exercés, ou sur le fait que l’IT n’ait pas payé les coûts de sauvegarde et de restauration

  • S’interroge sur l’existence d’une analyse globale

  • L’aspect intéressant de cette panne est que les systèmes "PROD" fonctionnaient surtout sous Linux et avec d’anciens logiciels propriétaires, et s’en sont bien sortis, tandis que les systèmes "CORP", fonctionnant surtout sous Windows, ont été durement touchés

    • Les systèmes bancaires n’avaient pas de problème pour déplacer l’argent, mais les systèmes en interaction avec les personnes en avaient
  • Le fait que Delta ait externalisé des capacités métier essentielles et réduit les contrats pour économiser a aggravé le problème

    • Espère que le coût des compensations versées aux clients dépassera les économies réalisées
    • Source : commentaire Reddit
  • Delta ne disposait pas de plan approprié de reprise après sinistre ni de plan de continuité d’activité IT

    • UA, AA et F9 ont immédiatement activé des plans préparés et se sont rétablies rapidement
    • UA et AA avaient déployé des plans partout, des fermes de serveurs aux solutions cloud, jusqu’aux postes utilisateurs finaux dans les aéroports
    • Delta avait externalisé une grande partie de son IT
    • UA et AA n’ont pas hésité à payer les heures supplémentaires du personnel
    • UA et AA dépendaient aussi de Windows autant que Delta
    • AA était rétablie à la fin de la journée de vendredi et a repris des opérations normales samedi
    • UA s’est rétablie environ 12 heures plus tard et a repris un horaire normal samedi après-midi
    • La responsabilité du problème incombe à 100 % aux décisions IT de Delta
    • Les employés IT subalternes recevront probablement l’essentiel du blâme et des conséquences
  • Aime que "CrowdStrike" soit désormais synonyme de "panne mondiale"

    • Ce n’est pas un nom mignon comme "heartbleed", mais le nom de l’entreprise qui a causé le problème