Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
REL09-BP04 Effectuer une restauration périodique des données pour vérifier l'intégrité et les processus de sauvegarde
Vérifiez que la mise en œuvre de votre processus de sauvegarde répond à vos objectifs de temps de restauration (RTO) et de point de restauration (RPO) en effectuant un test de restauration.
Résultat souhaité : Les données issues des sauvegardes sont périodiquement restaurées à l'aide de mécanismes bien définis afin de vérifier que la restauration est possible dans le délai de restauration fixé (RTO) pour la charge de travail. Vérifiez que la restauration à partir d'une sauvegarde aboutit à une ressource contenant les données d'origine sans qu'aucune de celles-ci ne soit corrompue ou inaccessible, et qu'elle entraîne une perte de données conforme à l'objectif du point de restauration (RPO).
Anti-modèles courants :
-
Restauration d’une sauvegarde, mais sans interroger ou récupérer des données pour vérifier l’utilisation de la restauration.
-
Supposer qu’une sauvegarde existe.
-
Supposer que la sauvegarde d’un système est pleinement opérationnelle et que les données peuvent être récupérées à partir de celle-ci.
-
En supposant que le délai de restauration ou de restauration des données à partir d'une sauvegarde correspond RTO à la charge de travail.
-
En supposant que les données contenues dans la sauvegarde correspondent à la RPO charge de travail
-
Effectuez une restauration si nécessaire, sans utiliser de runbook ou en dehors d’une procédure automatisée établie.
Avantages de cette bonne pratique : le test de restauration des sauvegardes permet de vérifier que les données peuvent être restaurées en cas de besoin sans craindre qu'elles soient manquantes ou endommagées, que la restauration et la restauration sont possibles dans le cadre de la RTO charge de travail et que toute perte de données est conforme à la charge RPO de travail.
Niveau d’exposition au risque si cette bonne pratique n’est pas respectée : moyen
Directives d’implémentation
Tester la fonctionnalité de sauvegarde et de restauration permet de garantir que ces actions peuvent être effectuées pendant une panne. Restaurez périodiquement les sauvegardes vers un nouvel emplacement et exécutez des tests pour vérifier l’intégrité des données. Certains tests courants à effectuer consistent à vérifier si toutes les données sont disponibles, ne sont pas corrompues, sont accessibles et si toute perte de données est conforme à la RPO charge de travail. De tels tests peuvent également aider à déterminer si les mécanismes de restauration sont suffisamment rapides pour s'adapter à la charge de travailRTO.
Vous pouvez ainsi mettre en AWS place un environnement de test et restaurer vos sauvegardes pour évaluer les RPO fonctionnalités, RTO et exécuter des tests sur le contenu et l'intégrité des données.
En outre, Amazon RDS et Amazon DynamoDB point-in-time autorisent la restauration (). PITR Grâce à la sauvegarde continue, vous pouvez restaurer votre jeu de données à l’état dans lequel il était à une date et une heure spécifiées.
Si toutes les données sont disponibles, ne sont pas endommagées, sont accessibles et que toute perte de données est imputable à la RPO charge de travail. De tels tests peuvent également aider à déterminer si les mécanismes de restauration sont suffisamment rapides pour s'adapter à la charge de travailRTO.
AWS Elastic Disaster Recovery propose des instantanés point-in-time de restauration continue des volumes AmazonEBS. Au fur et à mesure que les serveurs source sont répliqués, les point-in-time états sont chroniqués dans le temps en fonction de la politique configurée. Elastic Disaster Recovery vous aide à vérifier l’intégrité de ces instantanés en lançant des instances à des fins de test et d’analyse sans rediriger le trafic.
Étapes d’implémentation
-
Identifiez les sources de données qui sont actuellement sauvegardées et où ces sauvegardes sont stockées. Pour obtenir des conseils de mise en œuvre, consultez REL09-BP01 Identifiez et sauvegardez toutes les données qui doivent être sauvegardées, ou reproduisez les données à partir des sources.
-
Établissez des critères de validation des données pour chaque source de données. Différents types de données ont des propriétés différentes qui pourraient nécessiter des mécanismes de validation distincts. Réfléchissez à la manière dont ces données pourraient être validées avant de vous assurer que vous pouvez les utiliser en production. Certaines méthodes courantes de validation des données consistent à utiliser des propriétés de données et de sauvegarde telles que le type de données, le format, la somme de contrôle, la taille ou une combinaison de ces propriétés avec une logique de validation personnalisée. Par exemple, il peut s’agir d’une comparaison des valeurs de somme de contrôle entre la ressource restaurée et la source de données au moment de la création de la sauvegarde.
-
Établissez RTO et RPO restaurez les données en fonction de leur criticité. Pour obtenir des conseils de mise en œuvre, consultez REL13-BP01 Définir les objectifs de restauration en cas d'indisponibilité et de perte de données.
-
Évaluez votre capacité de récupération. Passez en revue votre stratégie de sauvegarde et de restauration pour déterminer si elle répond à vos RPO attentes, RTO et ajustez-la si nécessaire. À l’aide de AWS Resilience Hub, vous pouvez exécuter une évaluation de votre charge de travail. L'évaluation évalue la configuration de votre application par rapport à la politique de résilience et indique si vos RPO objectifs RTO et vos objectifs peuvent être atteints.
-
Effectuez un test de restauration avec les processus établis utilisés en production pour la restauration des données. Ces processus dépendent de la façon dont la source de données d’origine a été sauvegardée, du format et de l’emplacement de stockage de la sauvegarde elle-même, ou ils varient selon que les données sont reproduites à partir d’autres sources. Par exemple, si vous utilisez un service géré tel que AWS Backup, cela peut être aussi simple que de restaurer la sauvegarde dans une nouvelle ressource. Si vous avez utilisé AWS Elastic Disaster Recovery vous pouvez lancer une simulation de récupération.
-
Validez la récupération des données à partir de la ressource restaurée en fonction des critères que vous avez définis précédemment pour la validation des données. Les données restaurées et récupérées contiennent-elles l’enregistrement/l’élément le plus récent au moment de la sauvegarde ? Ces données correspondent-elles à la RPO charge de travail ?
-
Mesurez le temps nécessaire à la restauration et à la restauration et comparez-le à celui requisRTO. Ce processus s'inscrit-il dans le cadre RTO de la charge de travail ? Par exemple, comparez les horodatages du début du processus de restauration et de la fin de la validation de la récupération pour calculer la durée de ce processus. Tous les AWS API appels sont horodatés et ces informations sont disponibles dans. AWS CloudTrail Bien que ces informations puissent fournir des détails sur le début du processus de restauration, l’horodatage indiquant la fin de la validation doit être enregistré par votre logique de validation. Si vous utilisez un processus automatisé, des services tels qu’Amazon DynamoDB
peuvent être utilisés pour stocker ces informations. En outre, de nombreux AWS services fournissent un historique des événements qui fournit des informations horodatées lorsque certaines actions se sont produites. Dans AWS Backup ce cadre, les actions de sauvegarde et de restauration sont appelées tâches, et ces tâches contiennent des informations d'horodatage dans le cadre de leurs métadonnées, qui peuvent être utilisées pour mesurer le temps nécessaire à la restauration et à la restauration. -
Informez les parties prenantes si la validation des données échoue ou si le temps nécessaire à la restauration et à la restauration dépasse le délai fixé RTO pour la charge de travail. Lors de la mise en œuvre de l'automatisation à cette fin, comme dans cet atelier, des services tels qu'
Amazon Simple Notification Service (AmazonSNS) peuvent être utilisés pour envoyer des notifications push telles que des e-mails ou SMS aux parties prenantes. Ces messages peuvent également être publiés sur des applications de messagerie telles qu'Amazon Chime, Slack ou Microsoft Teams ou utilisés pour créer des tâches, comme dans le cas de Systems OpsItems Manager AWS. OpsCenter -
Automatisez ce processus pour qu’il s’exécute périodiquement. Par exemple, des services tels AWS Lambda qu'un State Machine in AWS Step Functions peuvent être utilisés pour automatiser les processus de restauration et de restauration, et Amazon EventBridge peut être utilisé pour invoquer régulièrement ce flux de travail d'automatisation, comme indiqué dans le schéma d'architecture ci-dessous. Découvrez comment automatiser la validation de la récupération de données avec AWS Backup
. De plus, cet atelier Well-Architected apporte une expérience pratique sur une façon d’automatiser plusieurs des étapes indiquées ici.
Niveau d’effort pour le plan de mise en œuvre : modéré à élevé selon la complexité des critères de validation.
Ressources
Documents connexes :
Exemples connexes :