灾难恢复(DR)目标 - 可靠性支柱

灾难恢复(DR)目标

除了可用性目标之外,韧性策略还应包括灾难恢复(DR)目标,这些目标基于发生灾难事件时恢复工作负载的策略。灾难恢复侧重于一次性恢复目标,可应对自然灾害、大规模技术故障或人为威胁(如攻击或错误)。这与可用性不同,可用性衡量的是一段时间内响应组件故障、负载峰值或软件错误的平均韧性。

恢复时间目标(RTO)由组织定义。RTO 是指服务中断和服务恢复之间可接受的最大延迟。这决定了当服务不可用时,什么时间段被视为可接受的时间窗口。

恢复点目标(RPO)由组织定义。RPO 是指自上一个数据恢复点以来可接受的最长时间。这决定了从上一个恢复点到服务中断之间可接受的数据丢失情况。

Business continuity timeline showing RPO, disaster event, and RTO with data loss and downtime periods.

RPO(恢复点目标)、RTO(恢复时间目标)和灾难事件之间的关系。

RTO 和 MTTR(平均恢复时间)相似,两者都测量中断开始到工作负载恢复之间的时间。但 MTTR 取的是一段时间内多次影响可用性的事件的平均值,而 RTO 则是单次可用性影响事件允许的目标或最大值。