本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS Resilience Hub – 彈性管理
AWS Resilience Hub 可讓您集中定義、驗證和追蹤 AWS 應用程式的彈性。 AWS Resilience Hub 可協助您保護應用程式免受中斷,並降低復原成本,以最佳化業務連續性,以協助符合合規和法規要求。您可以使用 AWS Resilience Hub 執行下列動作:
-
分析您的基礎設施並取得建議,以改善應用程式的彈性。除了改善應用程式彈性的架構指引之外,建議還提供程式碼以符合您的彈性政策、實作測試、警示和標準操作程序 (SOPs),您可以在整合和交付 (CI/CD) 管道中與應用程式一起部署和執行。
-
在不同條件下評估復原時間目標 (RTO) 和復原點目標 (RPO)。
-
最佳化業務連續性,同時降低復原成本。
-
在問題在生產中發生之前識別並解決問題。
將應用程式部署到生產環境後,您可以將 AWS Resilience Hub 新增至 CI/CD 管道,以便在每個建置發佈到生產環境之前進行驗證。
AWS Resilience Hub 運作方式
下圖提供如何 AWS Resilience Hub 運作的高階大綱。

- 描述
-
從 AWS CloudFormation 堆疊、Terraform 狀態檔案 AWS Resource Groups、Amazon Elastic Kubernetes Service 叢集匯入資源,或從已在 myApplications 中定義的應用程式進行選擇,來描述您的應用程式。
- 定義
-
為您的應用程式定義彈性政策。這些政策包括應用程式、基礎設施、可用區域和區域中斷的 RTO 和 RPO 目標。這些目標用於估計應用程式是否符合彈性政策。
- 評估
-
在您描述應用程式並將彈性政策附加到應用程式之後,請執行彈性評估。 AWS Resilience Hub 評估使用 Well-Architected Framework 的 AWS 最佳實務來分析應用程式的元件,並發現潛在的恢復能力弱點。這些弱點可能是基礎設施設定不完整、組態錯誤或需要額外組態改進的情況所造成。為了改善彈性,請根據評估報告的建議更新您的應用程式和彈性政策。建議包括元件、警示、測試和復原 SOPs組態。然後,您可以執行另一個評估,並將結果與先前的報告進行比較,以查看改善多少彈性。重複此程序,直到您的預估工作負載 RTO 和預估工作負載 RPO 符合您的 RTO 和 RPO 目標。
- 驗證
-
執行測試以測量 AWS 資源的彈性,以及從應用程式、基礎設施、可用區域和 AWS 區域 事件復原所需的時間。為了測量彈性,這些測試會模擬 AWS 資源的中斷。中斷的範例包括網路無法使用錯誤、容錯移轉、已停止的程序、Amazon RDS 開機復原,以及可用區域的問題。
- 檢視和追蹤
-
在將 AWS 應用程式部署到生產環境之後,您可以使用 繼續 AWS Resilience Hub 追蹤應用程式的彈性狀態。如果發生中斷,操作員可以在 中檢視中斷, AWS Resilience Hub 並啟動相關聯的復原程序。