AWS Resilience Hub — 弹性管理 - AWS 弹性中心

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

AWS Resilience Hub — 弹性管理

AWS Resilience Hub 为您提供了一个定义、验证和跟踪 AWS 应用程序弹性的中心位置。 AWS Resilience Hub 帮助您保护应用程序免受中断,并降低恢复成本以优化业务连续性,从而帮助满足合规性和监管要求。您可以使用 AWS Resilience Hub 执行以下操作:

  • 分析您的基础架构并获取建议,以提高应用程序的弹性。除了用于提高应用程序弹性的架构指南外,这些建议还提供了满足弹性策略、实施测试、警报和标准操作程序 (SOPs) 的代码,您可以在集成和交付 (CI/CD) 管道中与应用程序一起部署和运行这些代码。

  • 评估不同条件下的恢复时间目标(RTO) 和恢复点目标(RPO) 目标。

  • 优化业务连续性,同时降低恢复成本。

  • 在生产中出现问题之前识别并解决问题。

将应用程序部署到生产环境后,您可以添加 AWS Resilience Hub 到 CI/CD 管道中,以便在每个版本发布到生产环境之前对其进行验证。

如何 AWS Resilience Hub 运作

下图简要概述了 AWS Resilience Hub 工作原理。

显示 AWS Resilience Hub 工作原理的流程图。
描述

通过从 AWS CloudFormation 堆栈、Terraform 状态文件、Amazon Elastic Kubernetes Service 集群中导入资源来描述您的应用程序 AWS Resource Groups,或者您可以从 MyApplications 中已经定义的应用程序中进行选择。

定义

为您的应用程序定义弹性策略。这些策略包括应用程序、基础设施、可用区和区域中断的 RTO 和 RPO 目标。这些目标用于估计应用程序是否符合弹性策略。

评测

描述您的应用程序并向其附加弹性策略后,运行弹性评测。该 AWS Resilience Hub 评估使用 Well-Architect AWS ed Framework 中的最佳实践来分析应用程序的组件并发现潜在的弹性弱点。这些漏洞可能由于基础设施设置不完整、配置错误或需要进一步改进配置的情况造成。要提高弹性,请根据评测报告中的建议更新您的应用程序和弹性策略。建议包括组件、警报、测试和恢复的配置 SOPs。然后,您可以再进行一次评测,并将结果与之前的报告进行比较,以了解弹性在多大程度上得到了改善。重复此过程,直到您的估计工作负载 RTO 和估计的工作负载 RPO 达到您的 RTO 和 RPO 目标。

验证

运行测试以衡量 AWS 资源的弹性以及从应用程序、基础架构、可用区和 AWS 区域 事件中恢复所需的时间。为了衡量弹性,这些测试会模拟您的 AWS 资源中断情况。中断的示例包括网络不可用错误、失效转移、进程停止、Amazon RDS 启动恢复以及可用区问题。

查看和追踪

将 AWS 应用程序部署到生产环境后,您可以使用 AWS Resilience Hub 继续跟踪应用程序的弹性状况。如果发生中断,操作员可以查看中断情况 AWS Resilience Hub 并启动相关的恢复过程。