La disponibilità elevata e il ripristino di emergenza sono due cose diverse
La disponibilità e il ripristino di emergenza si basano su alcune delle stesse best practice, come il monitoraggio degli errori, la distribuzione in più posizioni e il failover automatico. Tuttavia, la disponibilità è incentrata sui componenti del carico di lavoro, mentre il ripristino di emergenza è basato su copie distinte dell'intero carico di lavoro. Il ripristino di emergenza ha obiettivi diversi dalla disponibilità, in quanto misura il tempo di ripristino dopo gli eventi su larga scala che si qualificano come emergenze. Devi innanzitutto assicurarti che il carico di lavoro realizzi gli obiettivi di disponibilità, in quanto un'architettura a disponibilità elevata ti permetterà di soddisfare le esigenze dei clienti in caso di eventi che hanno impatto sulla disponibilità. La strategia di ripristino di emergenza richiede approcci diversi rispetto a quelli per la disponibilità, concentrandosi sulla distribuzione di sistemi distinti in più posizioni per poter eseguire il failover dell'intero carico di lavoro, se necessario.
Devi tenere conto della disponibilità del carico di lavoro nella pianificazione del ripristino di emergenza, in quanto influirà sull'approccio adottato. Un carico di lavoro in esecuzione in una singola istanza Amazon EC2 in una zona di disponibilità non ha disponibilità elevata. Se un'inondazione locale colpisce la zona di disponibilità, questo scenario richiede il failover in un'altra zona di disponibilità per realizzare gli obiettivi di ripristino di emergenza. Confronta questo scenario con un carico di lavoro a disponibilità elevata distribuito come attivo/attivo multisito tra più regioni attive, in cui tutte le regioni gestiscono il traffico di produzione. In questo caso, anche nell'improbabile eventualità che un'emergenza su larga scala neutralizzi un'intera regione, la strategia di ripristino di emergenza viene attuata instradando tutto il traffico verso le regioni rimanenti.
Anche il modo in cui accostarsi ai dati è diverso tra disponibilità e ripristino di emergenza. Supponiamo una soluzione di archiviazione continuamente replicata in un altro sito per ottenere disponibilità elevata, ad esempio un carico di lavoro attivo/attivo multisito. Se uno o più file vengono eliminati o danneggiati nel dispositivo di archiviazione principale, le modifiche dannose possono essere replicate nel dispositivo di archiviazione secondario. In questo scenario, nonostante la disponibilità elevata, la capacità di failover in caso di eliminazione o corruzione dei dati risulterà compromessa. È invece necessario anche un backup point-in-time come parte di una strategia di ripristino di emergenza.