高可用性不是灾难恢复 - AWS 上的工作负载灾难恢复:云中的恢复

高可用性不是灾难恢复

可用性和灾难恢复都依赖于某些相同的最佳实践,例如监控故障、部署到多个位置以及自动故障转移。但是,可用性侧重于工作负载的组成部分,而灾难恢复则侧重于整个工作负载的分立副本。灾难恢复与可用性有着不同的目标,它衡量的是符合灾难定义的较大规模事件发生后的恢复时间。您应首先确保工作负载满足可用性目标,因为在发生影响可用性的事件时,高度可用的架构将使您能够满足客户的需求。您的灾难恢复策略需要不同于可用性策略的方法,重点是将分立系统部署到多个位置,以便在必要时可以对整个工作负载进行故障转移。

您必须在灾难恢复规划中考虑工作负载的可用性,因为这会影响您采取的方法。在一个可用区中的单个 Amazon EC2 实例上运行的工作负载没有高可用性。如果本地泛洪问题影响该可用区,则此场景需要故障转移到另一个可用区以实现灾难恢复目标。我们来将此场景与部署为多站点主动/主动模式的高可用性工作负载(工作负载部署在多个活动区域,并且所有区域都在为生产流量提供服务)进行比较。在这种情况下,即使发生了不太可能发生的大规模灾难摧毁整个区域的事件,也可通过将所有流量都路由到其余区域来实现灾难恢复策略。

可用性和灾难恢复之间处理数据的方式也有所不同。假设有一个存储解决方案,它将数据持续复制到另一站点以实现高可用性(例如多站点、主动/主动工作负载)。如果主存储设备上的一个或多个文件被删除或损坏,这些破坏性更改会被复制到辅助存储设备。在此场景中,尽管具有高可用性,但在数据删除或损坏时进行故障转移的能力将受到损害。而作为灾难恢复策略的一部分,还需要时间点备份。