彈性生命週期框架:持續改善彈性的方法 - AWS 規定指引

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

彈性生命週期框架:持續改善彈性的方法

Amazon Web Services貢獻者

2023 年十月 (文件歷史記錄)

如今,現代組織面臨著越來越多的彈性相關挑戰,尤其是當客戶的期望轉向始終在線且始終可用的思維方式時。遠端團隊和複雜的分散式應用程式加上對頻繁發行版本的需求不斷增加。因此,組織及其應用程式必須比以往任何時候都更具彈性。

AWS 將彈性定義為應用程式能夠抵抗或從中斷中復原的能力,包括與基礎結構、相依服務、錯誤設定和暫時性網路問題相關的問題。(請參閱 AWS Well-Architected 的架構可靠性支柱文件中的彈性和可靠性元件。) 但是,為了達到所需的彈性水平,通常需要權衡。營運複雜性、工程複雜性和成本將需要進行相應的評估和調整。

基於與客戶和內部團隊多年的合作, AWS 已經開發了一個彈性生命週期框架,以捕獲彈性學習和最佳實踐。該框架概述了下圖所示的五個關鍵階段。在每個階段,您都可以使用策略,服務和機制來改善彈性姿勢。

復原力生命週期

這些階段將在本指南的以下各節中討論:

術語和定義

每個階段的彈性概念應用於不同層級,從單個組件到整個系統。實施這些概念需要幾個術語的清晰定義:

  • 是執行功能的元素,由軟件和技術資源組成。元件的範例包括程式碼設定、基礎結構 (例如網路),甚至是伺服器、資料存放區,以及外部相依性 (例如多重要素驗證 (MFA) 裝置。

  • 應用程式是可提供商業價值的元件集合,例如面向客戶的網站店面或改善機器學習模型的後端程序。應用程式可能包含單一 AWS 帳戶中的元件子集,也可能是跨越多個 AWS 帳戶 和區域的多個元件的集合。 

  • 系統是管理特定業務功能所需的應用程式、人員和程序的集合。它包含執行功能所需的應用程式、持續整合與持續交付 (CI/CD)、可觀察性、組態管理、事件回應和災難復原等作業程序,以及管理此類工作的操作員。 

  • 中斷是阻止您的應用程式正確交付其業務功能的事件。

  • 減值是指中斷對應用程式沒有緩解的影響。如果應用程序遭受一系列中斷,則可能會受到損害。

持續彈性

彈性生命週期是一個持續的過程。即使在同一個組織中,您的應用程式團隊也可能會在每個階段執行不同的完整性層級,視應用程式的需求而定。但是,每個階段的完整性越高,您的應用程序將具有的彈性級別越高。

您應該將復原性生命週期視為組織可以運作的標準程序。 AWS 故意將彈性生命週期建模為類似於軟體開發生命週期 (SDLC),其目標是在開發和操作應用程式時整合整個作業程序中的規劃、測試和學習。 與許多敏捷開發流程一樣,彈性生命週期可以在開發過程的每次迭代中重複。  我們建議您隨著時間的推移逐步加深生命週期的每個階段中的做法。