進階異地同步備份復原模 - 進階異地同步備份復原模

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

進階異地同步備份復原模

出版日期:2023年7月11日(文件修訂)

許多客戶在高可用性的多重可用區域 (AZ) 組態中執行工作負載。這些架構在二進制故障事件期間表現良好,但經常遇到問題灰色失敗。這種類型的故障的表現可能是微妙的,並且無視快速而明確的檢測。本白皮書提供指引,說明如何檢測工作負載以偵測灰色故障所造成的影響 (隔離至單一可用區域),然後採取行動以減輕可用區域中的影響。

簡介

本文件的目的是協助您更有效地實作具備彈性的異地同步備份架構。建立彈性系統的最佳做法之一亞馬遜虛擬私有雲(VPC)網絡是將每個工作負載部署到多個可用區

一個可用區域是一或多個具備備援電源、網路和連線能力的獨立資料中心。使用多個可用區域可讓您操作比單一資料中心更具可用性、容錯能力和可擴充性的工作負載。

許多AWS服務,例如亞馬遜彈性運算雲(EC2)自動擴展或者亞馬遜關聯式資料庫(亞馬遜 RDS),提供異地同步備份配置。這些服務不需要您建立任何額外的可觀測性或容錯移轉工具。它們使工作負載具有彈性,可以輕鬆檢測到的二進制故障模式AWS 區域會影響單一可用區域。這可能是完全實體硬體故障、電源中斷或影響大部分資源的潛在軟體錯誤。

但是還有另一類失敗稱為灰色失敗, 其表現是微妙的,違抗快速和明確的檢測. 這反過來會導致更長的時間,以減輕故障引起的影響。本白皮書著重於灰色故障可能對異地同步備份架構造成的影響、如何偵測它們,以及如何減輕故障。

本白皮書提供的指引主要適用於以下特定類別的工作負載:

  • 主要使用區域AWS服務

  • 需要提高單一區域的韌性

  • 願意進行大量投資以建立所需的可觀察性和彈性模式

在這些工作負載中,您可能不願意做出一些或全部的權衡回應灰階故障,或者沒有使用多個區域的選項。這些類型的工作負載很可能代表整體產品組合的一小部分,因此應在工作負載層級與平台層級考慮此指引。