고가용성은 재해 복구가 아님
가용성과 재해 복구는 모두 오류 모니터링, 여러 위치에 배포, 자동 장애 조치 등 동일한 모범 사례에 의존합니다. 그러나 가용성은 워크로드의 구성 요소에 초점을 맞추는 반면 재해 복구는 전체 워크로드의 개별 복사본에 중점을 둡니다. 재해 복구의 목표는 가용성과는 다르며, 재해로 간주되는 대규모 이벤트 이후의 복구 시간을 측정합니다. 가용성에 영향을 미치는 이벤트가 발생할 경우 고가용성 아키텍처를 통해 고객의 요구를 충족할 수 있으므로 먼저 워크로드가 가용성 목표를 충족하는지 확인해야 합니다. 재해 복구 전략에는 가용성에 대한 방식과는 다른 방식이 필요하며, 필요한 경우 전체 워크로드에 대해 장애 조치를 수행할 수 있도록 개별 시스템을 여러 위치에 배포하는 데 중점을 둡니다.
재해 복구 계획에서 워크로드의 가용성은 어떤 방식을 취하느냐에 영향을 주므로 반드시 고려해야 합니다. 한 가용 영역의 단일 Amazon EC2 인스턴스에서 실행되는 워크로드는 고가용성이 없습니다. 로컬 플러딩 문제가 해당 가용 영역에 영향을 미치는 경우 이 시나리오에서는 DR 목표를 달성하기 위해 다른 AZ로의 장애 조치가 필요합니다. 이 시나리오를 다중 사이트 활성/활성로 배포된 고가용성 워크로드와 비교해봅니다. 이 워크로드는 여러 활성 리전에 배포되고 모든 리전은 프로덕션 트래픽을 처리합니다. 이 경우 예상치 못한 대규모 재해가 전체 리전에 영향을 주더라도 DR 전략은 모든 트래픽을 나머지 리전으로 라우팅하여 수행됩니다.
데이터에 접근하는 방식에서도 가용성과 재해 복구는 다릅니다. 고가용성(예: 다중 사이트, 활성/활성 워크로드)을 달성하기 위해 다른 사이트로 지속적으로 복제하는 스토리지 솔루션이 있다고 가정해 보겠습니다. 운영 스토리지 디바이스에서 파일이 삭제되거나 손상된 경우 이러한 파괴적인 변경 사항을 보조 스토리지 디바이스에 복제할 수 있습니다. 이 시나리오에서는 고가용성에도 불구하고 데이터 삭제 또는 손상 시 장애 조치 기능이 손상됩니다. 대신 DR 전략의 일부로 특정 시점으로 백업이 필요합니다.