REL09-BP01 Identifiez et sauvegardez toutes les données qui doivent être sauvegardées, ou reproduisez les données à partir des sources - Reliability Pillar

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

REL09-BP01 Identifiez et sauvegardez toutes les données qui doivent être sauvegardées, ou reproduisez les données à partir des sources

Identifiez et utilisez les fonctionnalités de sauvegarde des services et ressources de données utilisés par votre charge de travail. La plupart des services offrent des fonctionnalités permettant de sauvegarder vos données de charge de travail.

Résultat escompté : les sources de données ont été identifiées et classées en fonction de leur ordre d’importance. Ensuite, établissez une stratégie de récupération de données basée surRPO. Cette stratégie implique soit de sauvegarder ces sources de données, soit d’avoir la capacité de reproduire des données provenant d’autres sources. En cas de perte de données, la stratégie mise en œuvre permet la récupération ou la reproduction des données dans les limites définies RPO etRTO.

Phase de maturité du cloud : fondamentale

Anti-modèles courants :

  • Ne pas connaître toutes les sources de données pour la charge de travail ni leur ordre d’importance.

  • Ne pas effectuer de sauvegardes des sources de données critiques.

  • Sauvegarder uniquement certaines sources de données sans utiliser leur ordre d’importance comme critère.

  • Aucune fréquence définieRPO, ou la fréquence de sauvegarde ne peut pas être atteinteRPO.

  • Ne pas évaluer si une sauvegarde est nécessaire ou si les données peuvent être reproduites à partir d’autres sources.

Avantages liés au respect de cette bonne pratique : identifier les emplacements où les sauvegardes sont nécessaires et mettre en place un mécanisme pour créer des sauvegardes, ou être capable de reproduire les données à partir d’une source externe améliore la capacité de restauration et de récupération des données lors d’une panne.

Niveau d’exposition au risque si cette bonne pratique n’est pas respectée : élevé

Directives d’implémentation

Tous les magasins AWS de données offrent des fonctionnalités de sauvegarde. Des services tels qu'Amazon RDS et Amazon DynamoDB prennent également en charge la sauvegarde automatique qui point-in-time permet de récupérer PITR (), ce qui vous permet de restaurer une sauvegarde à tout moment jusqu'à cinq minutes ou moins avant l'heure actuelle. De nombreux AWS services offrent la possibilité de copier des sauvegardes vers un autre Région AWS. AWS Backup est un outil qui vous permet de centraliser et d'automatiser la protection des données dans l'ensemble des AWS services. AWS Elastic Disaster Recoveryvous permet de copier les charges de travail complètes du serveur et de maintenir une protection continue des données sur site, entre zones azimuts ou entre régions, avec un objectif de point de restauration (RPO) mesuré en secondes.

Amazon S3 peut être utilisé comme destination de sauvegarde pour les sources de données autogérées et AWS gérées. AWS des services tels qu'Amazon EBSRDS, Amazon et Amazon DynamoDB ont intégré des fonctionnalités permettant de créer des sauvegardes. Vous pouvez aussi utiliser des logiciels de sauvegarde tiers.

Les données sur site peuvent être sauvegardées à l' AWS Cloud aide de AWS Storage Gatewayou AWS DataSync. Les compartiments Amazon S3 peuvent être utilisés pour stocker ces données sur AWS. Amazon S3 propose plusieurs niveaux de stockage tels qu’Amazon S3 Glacier ou S3 Glacier Deep Archive pour réduire les coûts du stockage de données.

Il se peut que vous puissiez répondre aux besoins de récupération de données en reproduisant les données à partir d’autres sources. Par exemple, les nœuds de réplication Amazon ou les ElastiCache répliques de RDS lecture Amazon peuvent être utilisés pour reproduire des données en cas de perte du nœud principal. Dans les cas où de telles sources peuvent être utilisées pour atteindre votre objectif de point de restauration (RPO) et votre objectif de temps de restauration (RTO), il se peut que vous n'ayez pas besoin de sauvegarde. Autre exemple : si vous travaillez avec AmazonEMR, il n'est peut-être pas nécessaire de sauvegarder votre HDFS banque de données, tant que vous pouvez reproduire les données dans Amazon EMR à partir d'Amazon S3.

Lors de la sélection d’une stratégie de sauvegarde, tenez compte du temps nécessaire pour récupérer les données. Le temps nécessaire pour récupérer les données dépend du type de sauvegarde (dans le cas d’une stratégie de sauvegarde) ou de la complexité du mécanisme de reproduction des données. Ce temps doit être conforme à la RTO charge de travail.

Étapes d’implémentation

  1. Identifiez toutes les sources de données pour la charge de travail. Les données peuvent être stockées sur un certain nombre de ressources telles que les bases de données, les volumes, les systèmes de fichiers, les systèmes de journalisation et le stockage d’objets. Reportez-vous à la section Ressources pour trouver des documents connexes sur les différents AWS services où les données sont stockées et sur la capacité de sauvegarde que ces services fournissent.

  2. Classez les sources de données en fonction de leur ordre d’importance. Différents jeux de données ont différents niveaux d’importance pour une charge de travail, et donc différentes exigences en matière de résilience. Par exemple, certaines données peuvent être critiques et nécessiter une valeur RPO proche de zéro, tandis que d'autres données peuvent être moins critiques et peuvent tolérer une perte de données plus élevée RPO et une certaine perte de données. De même, différents ensembles de données peuvent également avoir RTO des exigences différentes.

  3. Utilisez AWS des services tiers pour créer des sauvegardes des données. AWS Backupest un service géré qui permet de créer des sauvegardes de différentes sources de données sur AWS. AWS Elastic Disaster Recoverygère la réplication automatique des données en moins d'une seconde vers un Région AWS. La plupart AWS des services disposent également de fonctionnalités natives permettant de créer des sauvegardes. AWS Marketplace Il propose également de nombreuses solutions qui offrent ces fonctionnalités. Consultez Ressources ci-dessous pour découvrir comment créer des sauvegardes de données à partir de divers services AWS .

  4. Pour les données non sauvegardées, définissez un mécanisme de reproduction des données. Vous pouvez choisir de ne pas sauvegarder les données qui peuvent être reproduites à partir d’autres sources pour diverses raisons. Il peut arriver qu’il soit moins coûteux de reproduire des données à partir de sources en cas de besoin plutôt que de créer une sauvegarde, car le stockage des sauvegardes peut impliquer un coût. Autre exemple : la restauration à partir d'une sauvegarde prend plus de temps que la reproduction des données à partir des sources, ce qui entraîne une violation. RTO Dans de telles situations, envisagez les avantages et inconvénients de chaque approche et définissez un processus clair sur la façon dont les données peuvent être reproduites à partir de ces sources lorsque la récupération des données est nécessaire. Par exemple, si vous avez chargé des données depuis Amazon S3 dans un entrepôt de données (comme Amazon Redshift) ou dans un MapReduce cluster (comme AmazonEMR) pour analyser ces données, il peut s'agir d'un exemple de données pouvant être reproduites à partir d'autres sources. Tant que les résultats de ces analyses sont stockés quelque part ou sont reproductibles, vous ne subirez aucune perte de données en cas de défaillance de l'entrepôt de données ou du MapReduce cluster. Parmi les autres exemples qui peuvent être reproduits à partir de sources, citons les caches (comme Amazon ElastiCache) ou les répliques de RDS lecture.

  5. Spécifiez un rythme de sauvegarde des données. La création de sauvegardes des sources de données est un processus périodique dont la fréquence doit dépendre duRPO.

Niveau d’effort du plan d’implémentation : modéré

Ressources

Bonnes pratiques associées :

REL13-BP01 Définir les objectifs de restauration en cas d'indisponibilité et de perte de données

REL13-BP02 Utiliser des stratégies de rétablissement définies pour atteindre les objectifs de rétablissement

Documents connexes :

Vidéos connexes :

Exemples connexes :