Les systèmes de sauvegarde opèrent sur plusieurs couches où la cohérence, la synchronisation et les
modes de panne déterminent si la reprise est possible. Les pannes peuvent inclure
des snapshots incomplets, des états de bases incohérents, des corruptions silencieuses,
des données manquantes ou des sauvegardes qui ne se restaurent pas en conditions réelles.
Différents types de données demandent des approches différentes. Systèmes de fichiers, bases
de données et données applicatives sont traités selon leur comportement en panne, pas
comme un jeu de données uniforme.
L’intégrité des sauvegardes est vérifiée par tests de restauration, validation de
sommes de contrôle et inspection directe, plutôt que par hypothèse sur le succès de la tâche. Le
stockage est évalué sur l’isolation, la rétention et la résistance à la
modification, en particulier sous erreur opérateur ou activité malveillante.
Les outils incluent des mécanismes de snapshot comme LVM ou
ZFS; des outils de synchronisation de fichiers comme rsync ou
lsyncd; des utilitaires de bases de données comme
mysqldump ou pg_dump; des configurations de
réplication primaire-réplique; et des systèmes de sauvegarde dont
restic ou borgbackup.
Les outils sont choisis sur les objectifs de reprise, les contraintes des systèmes
et les modes de panne observés. La mise en place varie selon les environnements.