Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
REL09-BP01 Identifica ed esegui il backup di tutti i dati di cui è necessario eseguire il backup o riproduci i dati dalle fonti
Scopri e utilizza le funzionalità di backup dei servizi e delle risorse di dati usati dal carico di lavoro. La maggior parte dei servizi offre funzionalità per eseguire il backup dei dati del carico di lavoro.
Risultato desiderato: le origini dati sono state identificate e classificate in base alla criticità. Quindi, stabilisci una strategia per il ripristino dei dati basata su. RPO Questa strategia prevede il backup di queste origini dati o la possibilità di riprodurre i dati da altre origini. In caso di perdita di dati, la strategia implementata consente il recupero o la riproduzione dei dati all'interno del territorio definito RPORTO.
Fase di maturità del cloud: di base
Anti-pattern comuni:
-
Mancata conoscenza di tutte le origini dati per il carico di lavoro e della loro criticità.
-
Non si eseguono backup delle origini dati critiche.
-
Esecuzione di backup solo di alcune origini dati senza utilizzare la criticità come criterio.
-
Nessuna frequenza definita RPO o di backup non può essere soddisfattaRPO.
-
Nessuna valutazione della necessità di un backup o della possibilità di riprodurre i dati da altre origini.
Vantaggi dell'adozione di questa best practice: l'identificazione dei punti in cui sono necessari i backup e l'implementazione di un meccanismo per la creazione di backup, o la possibilità di riprodurre i dati da una fonte esterna, migliorano la capacità di ripristinare e recuperare i dati durante un'interruzione.
Livello di rischio associato se questa best practice non fosse adottata: elevato
Guida all'implementazione
Tutti gli archivi AWS dati offrono funzionalità di backup. Servizi come Amazon RDS e Amazon DynamoDB supportano inoltre il backup automatico che point-in-time consente il ripristino PITR (), che consente di ripristinare un backup in qualsiasi momento fino a cinque minuti o meno prima dell'ora corrente. Molti AWS servizi offrono la possibilità di copiare i backup su un altro. Regione AWS AWS Backup è uno strumento che offre la possibilità di centralizzare e automatizzare la protezione dei dati tra i servizi. AWS AWS Elastic Disaster Recovery
Amazon S3 può essere utilizzato come destinazione di backup per sorgenti di dati autogestite e AWS gestite. AWS servizi come AmazonEBS, Amazon e Amazon RDS DynamoDB dispongono di funzionalità integrate per creare backup. È anche possibile utilizzare software di backup di terze parti.
È possibile eseguire il backup dei dati locali per l'utilizzo o. Cloud AWS AWS Storage GatewayAWS DataSync È possibile usare i bucket Amazon S3 per archiviare questi dati in AWS. Amazon S3 offre più livelli di archiviazione come Amazon S3 Glacier o S3 Glacier Deep Archive per ridurre i costi dell'archiviazione di dati.
Potresti essere in grado di soddisfare le esigenze di recupero dei dati riproducendo i dati da altre origini. Ad esempio, i nodi di ElastiCache replica Amazon o le repliche di RDS lettura di Amazon potrebbero essere utilizzati per riprodurre i dati in caso di perdita del primario. Nei casi in cui fonti come questa possono essere utilizzate per soddisfare i tuoi obiettivi Recovery Point Objective (RPO) e Recovery Time Objective (RTO), potresti non aver bisogno di un backup. Un altro esempio, se lavori con AmazonEMR, potrebbe non essere necessario eseguire il backup del tuo HDFS data store, purché sia possibile riprodurre i dati in Amazon EMR da Amazon
Quando scegli una strategia di backup, devi considerare il tempo necessario per il ripristino dei dati. Il tempo necessario per il ripristino dei dati dipende dal tipo di backup (nel caso di una strategia di backup) o dalla complessità del meccanismo di riproduzione dei dati. Questo tempo dovrebbe rientrare nel carico RTO di lavoro.
Passaggi dell'implementazione
-
Identifica tutte le origini dati per il carico di lavoro. L'archiviazione dei dati può avvenire su varie risorse come database
, volumi, file system, sistemi di log e storage a oggetti. Consulta la sezione Risorse per trovare i documenti correlati sui diversi AWS servizi in cui vengono archiviati i dati e sulle funzionalità di backup fornite da questi servizi. -
Classifica le origini dati in base alla criticità. I diversi set di dati avranno diversi livelli di criticità per un carico di lavoro e quindi diversi requisiti di resilienza. Ad esempio, alcuni dati potrebbero essere critici e richiederne una quantità RPO prossima allo zero, mentre altri dati potrebbero essere meno critici e tollerare una perdita di dati maggiore RPO e parziale. Analogamente, anche set di dati diversi potrebbero avere RTO requisiti diversi.
-
Utilizza AWS i nostri servizi di terze parti per creare backup dei dati. AWS Backupè un servizio gestito che consente di creare backup di varie fonti di dati su. AWSAWS Elastic Disaster Recovery
gestisce la replica automatica dei dati in meno di un secondo su un. Regione AWS La maggior parte AWS dei servizi dispone anche di funzionalità native per la creazione di backup. Marketplace AWS Ha molte soluzioni che forniscono anche queste funzionalità. Consulta la sezione Risorse più avanti per informazioni su come creare backup dei dati da vari servizi AWS . -
Per i dati non sottoposti a backup, definisci un meccanismo di riproduzione dei dati. Puoi decidere di non eseguire il backup di dati riproducibili da altre origini per vari motivi. Potrebbe essere più conveniente riprodurre i dati dalle origini, quando necessario, piuttosto che creare un backup, dato che l'archiviazione dei backup può comportare dei costi. Un altro esempio è il caso in cui il ripristino da un backup richiede più tempo rispetto alla riproduzione dei dati dalle fonti, con conseguente violazione. RTO In queste situazioni, è necessario considerare i compromessi e stabilire un processo ben definito per la riproduzione dei dati da queste origini quando è necessario il ripristino dei dati. Ad esempio, se hai caricato dati da Amazon S3 in un data warehouse (come Amazon Redshift) MapReduce o in un cluster (come EMR Amazon) per eseguire analisi su tali dati, questo potrebbe essere un esempio di dati che possono essere riprodotti da altre fonti. Finché i risultati di queste analisi sono archiviati da qualche parte o riproducibili, non si verificherebbe alcuna perdita di dati a causa di un guasto nel data warehouse o nel cluster. MapReduce Altri esempi che possono essere riprodotti dai sorgenti includono le cache (come Amazon ElastiCache) o le repliche di RDS lettura.
-
Definisci una cadenza per il backup dei dati. La creazione di backup delle fonti di dati è un processo periodico e la frequenza deve dipendere da. RPO
Livello di impegno per il piano di implementazione: moderato
Risorse
Best practice correlate:
REL13-BP01 Definizione degli obiettivi di ripristino in caso di downtime e perdita di dati
REL13-BP02 Utilizzo di strategie di ripristino definite per conseguire gli obiettivi di ripristino
Documenti correlati:
Video correlati:
Esempi correlati:
-
Well-Architected Lab - Implementazione della replica bidirezionale tra regioni () per Amazon S3 CRR
-
Well-Architected Lab: esecuzione di test del backup e del ripristino di dati
-
Well-Architected Lab: backup e ripristino con failback per un carico di lavoro di analisi
-
Well-Architected Lab: ripristino di emergenza, backup e ripristino