- Le site horaire du NIST à Boulder, dans le Colorado, a été mis à l’arrêt pendant plusieurs jours à cause d’une panne de courant ; en raison d’une panne du groupe électrogène de secours, un écart maximal de 5 μs par rapport à l’UTC a été observé
- Ce site, qui exploite 6 serveurs NTP, a maintenu une dérive inférieure à 5 μs malgré la panne du générateur, avec un impact quasi nul pour les utilisateurs ordinaires
- Des organismes de recherche scientifique et des entreprises de l’aérospatial, qui dépendent d’un timing de haute précision, peuvent en revanche avoir été affectés ; le NIST travaille directement avec eux
- Les systèmes GPS et WWV-Ft. Collins ont assuré correctement leur rôle de secours, démontrant la redondance de l’infrastructure temporelle à l’échelle des États-Unis
- Cet incident met en lumière les risques d’une dépendance au GPS et la fragilité des infrastructures de synchronisation, tout en soulignant la nécessité de développer des systèmes PNT alternatifs
Coupure de courant et apparition d’un écart temporel
- Le campus du NIST à Boulder, Colorado, a subi des vents dépassant 160 km/h (100 mph), poussant le fournisseur d’électricité à couper l’alimentation pour prévenir les risques d’incendie
- L’ensemble du campus a été bouclé, rendant l’accès impossible aux employés, ce qui a retardé la remise en service
- L’un des groupes électrogènes de secours est tombé en panne au bout de deux jours, privant d’alimentation l’ensemble principal d’horloges (clock ensemble) des serveurs NTP
- Jeff Sherman, responsable du Time Realization and Distribution Group, a même envisagé de couper les serveurs pour éviter de diffuser une heure inexacte
- Heureusement, le système d’horloges d’un autre bâtiment a pu transmettre le signal horaire, et certains employés restés sur place ont rétabli la situation en redirigeant l’alimentation de secours
- Le secours par batterie (UPS) a maintenu l’heure jusqu’au remplacement du générateur ; au final, l’écart avec l’UTC est resté inférieur à 5 μs
Exploitation des serveurs NTP et étendue de l’impact
- Le NIST fournit un service horaire sur Internet via 6 serveurs NTP principaux
- D’après le résultat de la commande
sntp time-a-b.nist.gov, l’erreur due à la latence réseau pour un utilisateur ordinaire est d’environ 35 millisecondes (35 000 μs) ; un écart de 5 μs est donc négligeable
- Le service a donc été maintenu sans interruption ; la précision était environ 5 000 fois moins bonne qu’en temps normal, mais sans effet pour la plupart des utilisateurs
- Les universités, acteurs de l’aérospatial et instituts de recherche scientifique sont, eux, sensibles au moindre écart ; le NIST travaille directement avec eux sur les corrections nécessaires
- Le système GPS américain a automatiquement basculé vers le campus WWV-Ft. Collins, ce qui a permis de maintenir le service sans interruption générale
Fragilité de l’infrastructure temporelle et technologies alternatives
- L’auteur exploite son propre serveur NTP avec deux horloges GPS basées sur Raspberry Pi et souligne les risques liés à la dépendance au GPS
- La CISA a déjà averti des risques de surdépendance des États-Unis au GPS, et le gouvernement pousse au développement de technologies PNT (Position, Navigation, Timing) alternatives
- Le Broadcast Positioning System (BPS) est évoqué comme candidat possible pour remplacer le GPS
- L’auteur utilise une horloge atomique au rubidium et un GPSDO pour maintenir une précision de l’ordre de quelques nanosecondes, avec la possibilité de conserver l’heure pendant plusieurs mois même en cas de perturbation du signal GPS
- Les secteurs scientifique, RF, médias et finance, entre autres, exigent toutefois une précision à l’échelle de la nanoseconde, et la plupart se réfèrent au temps de référence du NIST
Enseignements et fiabilité du système
- Cet incident prouve que le dispositif de réponse aux sinistres du NIST a effectivement fonctionné, en montrant une exploitation normale malgré un léger écart
- La combinaison de redondances électriques, de multiples horloges et d’un système de secours GPS a permis de préserver la stabilité de l’infrastructure temporelle nationale
- L’auteur insiste sur le fait que les infrastructures de synchronisation sont très fragiles et nécessitent plusieurs niveaux de secours
- Même dans une situation critique à l’échelle de la microseconde, l’équipe du NIST a résolu le problème de manière suffisamment transparente pour que la plupart des utilisateurs ne s’en aperçoivent pas
Aucun commentaire pour le moment.