Horloges, GPS & météo spatiale
Tempêtes solaires qui perturbent le GPS, échecs TLS par dérive d’horloge, systèmes distribués qui ne partagent plus la même notion du temps.
Des problèmes de timing subtils peuvent casser des systèmes bien conçus.
Des pannes bien réelles, causées par des choses qu’aucun schéma d’architecture n’inclut. Pas du folklore. Pas des cas d'école. Juste la réalité qui s'invite.
Dernière relecture: mars 2026
La plupart des pannes viennent d’erreurs ordinaires. D’autres viennent de la physique, de la biologie, de l’économie, de la météo, du comportement humain ou d’événements qui ignorent vos hypothèses.
Cette page documente des incidents qui paraissent absurdes après coup, mais qui révèlent des couplages cachés, des hypothèses fragiles et des choix de conception trop optimistes.
Les exemples sont tirés d’expérience directe, de post-mortems publics et d’incidents largement documentés. Ils sont illustratifs, pas exhaustifs.
Ces incidents peuvent sembler absurdes, mais ils reflètent des pannes réelles causées par des détails oubliés, des facteurs environnementaux ou des hypothèses fragiles. Les comprendre alimente une conception plus résiliente.
Tempêtes solaires qui perturbent le GPS, échecs TLS par dérive d’horloge, systèmes distribués qui ne partagent plus la même notion du temps.
Des problèmes de timing subtils peuvent casser des systèmes bien conçus.
Des fourmis qui court-circuitent, des serpents qui se promènent dans les armoires, des rongeurs qui croquent la fibre, des oiseaux qui déclenchent les alertes incendie.
Le cloisonnement physique et l'attention portée à l'environnement sont essentiels.
Disques perturbés par des travaux voisins, baies qui vibrent, résonance liée à la vitesse des ventilateurs provoquant des reboots.
Des interactions physiques inattendues peuvent perturber des systèmes stables.
Sous-tensions, sur-tensions, déséquilibres de phase, dérive de fréquence, alimentations disponibles mais instables, onduleurs ou groupes électrogènes capricieux.
La qualité de l’alimentation compte plus que sa simple disponibilité.
Équipes de travaux qui coupent 432 fibres à la pelleteuse, alimentation partagée surchargée, agents d’entretien qui débranchent du matériel.
L’exploitation cohabite toujours avec les contraintes du monde réel.
Pannes à la seconde intercalaire, mauvaises configurations DST, retrait de baies « inutilisées » qui rompt le flux d’air, liens de secours saturés.
Les conditions non idéales révèlent les hypothèses cachées.
Ces incidents ne sont pas des excuses. Ils rappellent que l’infrastructure existe dans le monde réel, avec sa météo, ses animaux, ses humains, les lois de la physique et le temps qui passe.
Les systèmes conçus avec humilité se comportent mieux en situation dégradée que les systèmes conçus avec assurance.
Voir aussi: Infrastructure calme, Principes d’architecture et Gestion d’incidents.