Accueil · Exploitation opérationnelle · Gestion des sauvegardes

Gestion des sauvegardes pour infrastructure Linux

Les sauvegardes existent pour la panne. Elles ne valent que si on peut les restaurer sous pression.

Dernière relecture: mars 2026

Description ce n’est pas un plan de stockage § 1

Les sauvegardes ne sont pas une case à cocher, un produit de stockage ni un livrable de conformité. Gérer les sauvegardes, c’est prendre la responsabilité opérationnelle de la façon dont les données sont protégées et restaurées, et dont les décisions de reprise sont prises quand les hypothèses ne tiennent plus.

L’accent porte sur les scénarios de panne réalistes: erreur opérateur, bug logiciel, rançongiciel, perte matérielle, panne fournisseur, et corruption partielle ou silencieuse.

Les résultats des sauvegardes, les vérifications et les journaux de restauration sont intégrés à la documentation opérationnelle pour la responsabilité, la planification et les revues post-incident.

Trois responsabilités § 2
01

Choisir la bonne approche

Stratégies conçues par système et par charge de travail: snapshots de systèmes de fichiers, dumps logiques de bases de données, réplication physique, ou une combinaison de ces approches. Outils choisis pour des modes de panne réalistes, pas pour la mode.

02

Séparer ce qui doit survivre

Sauvegardes isolées de la production pour réduire les domaines de panne partagés. La rétention équilibre la reprise, le coût et la responsabilité. Quand c’est pertinent, du stockage immuable réduit le risque de modification accidentelle ou malveillante.

03

Répéter la restauration

Sauvegardes validées périodiquement par restauration en conditions contrôlées. Vérification automatisée (checksum, restaurations test) quand c’est faisable. Intégrée à la supervision et à la gestion des incidents.

Une sauvegarde jamais restaurée est une hypothèse, pas un plan.
Pensées pour la panne § 3

Les systèmes de sauvegarde tombent de façon prévisible. Les tâches s’arrêtent. Les identifiants expirent. Le stockage se remplit. La réplication prend du retard. Les restaurations prennent plus de temps que prévu. On récupère des données partielles.

La gestion des sauvegardes inclut supervision, vérification et revue périodique pour détecter ces pannes tôt et les corriger avant que la reprise ne soit nécessaire.

Aucune sauvegarde n’est absolue § 4

Les sauvegardes réduisent le risque. Elles ne l’effacent pas. Aucun système de sauvegarde ne peut garantir la reprise, l’exhaustivité ou la continuité métier dans tous les scénarios. Le temps de reprise et la perte de données dépendent de la panne, de l’intégrité des données et de la conception du système.

Les frontières de couverture, exclusions, durées de rétention et responsabilités de restauration sont définies explicitement. La gestion des sauvegardes s’inscrit typiquement dans une mission d’exploitation opérationnelle continue. Des sauvegardes autonomes sans contexte opérationnel peuvent échouer en silence.

Les responsabilités de sauvegarde, l’autorité sur les restaurations et les chemins d’escalade sont définis par phase de mission et ne persistent pas hors d’une relation de gestion active, comme décrit dans le cycle d’une mission.

Outils § 5

Les systèmes de sauvegarde opèrent sur plusieurs couches où la cohérence, la synchronisation et les modes de panne déterminent si la reprise est possible. Les pannes peuvent inclure des snapshots incomplets, des états de bases incohérents, des corruptions silencieuses, des données manquantes ou des sauvegardes qui ne se restaurent pas en conditions réelles.

Différents types de données demandent des approches différentes. Systèmes de fichiers, bases de données et données applicatives sont traités selon leur comportement en panne, pas comme un jeu de données uniforme.

L’intégrité des sauvegardes est vérifiée par tests de restauration, validation de sommes de contrôle et inspection directe, plutôt que par hypothèse sur le succès de la tâche. Le stockage est évalué sur l’isolation, la rétention et la résistance à la modification, en particulier sous erreur opérateur ou activité malveillante.

Les outils incluent des mécanismes de snapshot comme LVM ou ZFS; des outils de synchronisation de fichiers comme rsync ou lsyncd; des utilitaires de bases de données comme mysqldump ou pg_dump; des configurations de réplication primaire-réplique; et des systèmes de sauvegarde dont restic ou borgbackup.

Les outils sont choisis sur les objectifs de reprise, les contraintes des systèmes et les modes de panne observés. La mise en place varie selon les environnements.

FAQ § 6

Fournissez-vous des sauvegardes hors-site?

Parfois. Les sauvegardes peuvent être stockées sur l’infrastructure du client, sur celle que j’exploite, ou les deux. Le choix dépend des domaines de panne, des objectifs de reprise et du risque opérationnel, pas d’un package prédéfini.

Pour plus de résilience, les sauvegardes hors-site peuvent passer par un réseau de gestion privé, qui assure redondance et isolation entre fournisseurs.

Les sauvegardes sont-elles chiffrées?

Le chiffrement est appliqué quand c’est approprié, quand les systèmes sous-jacents le permettent, selon la sensibilité de la donnée, les chemins d’accès et les contraintes opérationnelles.

Les clients peuvent-ils restaurer eux-mêmes?

Les restaurations sont réalisées délibérément. Le libre-service n’est pas fourni par défaut, parce qu’il augmente souvent le risque pendant les incidents et complique la responsabilité.

Cela protège-t-il des rançongiciels?

Les sauvegardes peuvent réduire l’impact d’un rançongiciel, mais ne garantissent pas la reprise. Isolation, profondeur de rétention, stockage immuable et timing de détection déterminent ce qui est possible. Une compromission ou une détection tardive peut quand même entraîner une perte partielle ou totale.

À quelle fréquence sont-elles vérifiées?

Les tâches de sauvegarde, la réplication et l’état du stockage sont supervisés en continu via des contrôles automatiques. Les procédures de restauration et routines de vérification sont revues et testées périodiquement.

Est-ce un service autonome?

La gestion des sauvegardes est normalement fournie dans le cadre d’une mission d’exploitation continue. Les sauvegardes sans contexte opérationnel ont tendance à échouer en silence.

Stratégie hors-site sur deux fournisseurs § 7

Quand une redondance au-delà d’un seul site distant se justifie, les sauvegardes peuvent être répliquées chez deux fournisseurs indépendants situés dans des régions géographiques différentes. Deux fournisseurs réduisent le risque lié à un fournisseur unique: un litige de facturation, une suspension de compte ou une panne régionale chez l’un d’eux ne compromet pas l’ensemble de la capacité de reprise.

Les plannings sont décalés pour éviter la saturation de la bande passante, et la fiabilité des fournisseurs est réévaluée périodiquement. Cette approche échange un peu de coût de stockage brut contre de la résilience; elle ne remplace pas un stockage de niveau entreprise avec SLA, support fournisseur garanti et réplication immédiate.

Quand un contrôle opérationnel plus élevé est nécessaire, cette configuration deux fournisseurs passe par un réseau de gestion privé: tunnels WireGuard chiffrés entre nœuds, plages d’IP privées dédiées par client, et séparation logique des trafics de sauvegarde, supervision et gestion. Des nœuds redondants chez plusieurs fournisseurs permettent aux chemins de sauvegarde de basculer sans compromettre l’isolation ni la prévisibilité du routage. Le réseau est exploité comme une infrastructure, pas comme un service tiers: routage, règles de pare-feu et procédures de reprise sont documentés et exercés.

En pratique, ça signifie § 8
  • Les procédures de restauration ont été testées avant d’en avoir besoin.
  • Le temps de reprise est connu à l’avance, pas estimé sous pression.
  • Les tâches de sauvegarde sont supervisées; les anomalies remontent avant de devenir des problèmes de reprise.
  • Les données sont protégées sur des domaines de panne distincts, pas copiées sur la même infrastructure qu’elles protègent.
Pour aller plus loin § 9

La gestion des sauvegardes fait partie de la responsabilité long terme d’infrastructure.

Discuter de votre infrastructure → Exploitation opérationnelle