REL01-BP02 管理跨帳戶和區域的服務配額 - 可靠性支柱

REL01-BP02 管理跨帳戶和區域的服務配額

如果您使用多個帳戶或區域,請在生產工作負載執行的所有環境中都要求合適的配額。

預期成果:對於跨帳戶或區域的組態,或使用地區、區域或帳戶容錯移轉具有彈性設計的組態,服務和應用程式不應受到服務配額耗盡的影響。

常見的反模式:

  • 允許一個隔離區域內的資源用量增長,但無維持其他隔離區域中容量的機制。

  • 在隔離區域中單獨手動設定所有配額。

  • 未考量彈性架構 (例如主動或被動) 日後在非主要區域降級期間對配額需求產生的影響。

  • 未定期評估配額,並在工作負載執行所在的每個區域和帳戶中進行必要的變更。

  • 不要利用配額請求範本在多個區域和帳戶之間請求增加。

  • 因誤認為增加配額會產生成本上的影響 (例如運算保留要求) 而未更新服務配額。

建立此最佳實務的優勢:確認如果區域服務無法使用時,您可以處理次要區域或帳戶中目前的負載。這有助於降低區域中斷期間發生的錯誤數量或降級程度。

未建立此最佳實務時的曝險等級:

實作指引

系統會針對每個帳戶追蹤服務配額。除非另有說明,否則每個配額都是 AWS 區域 特有的。除生產環境之外,也會在所有適用的非生產環境中管理配額,因此不會阻礙測試和開發。要維持高水準的彈性,必須持續評估服務配額 (無論自動還是手動)。

由於採用主動/主動主動/被動 - 熱主動/被動 - 冷,以及主動/被動- 指示燈方法實作設計,跨區域的工作負載越來越多,因此了解所有區域和帳戶配額級別至關重要。過去的流量模式不一定可明確指出服務配額是否正確設定。

同樣重要的是,每個區域的服務配額名稱限制不一定相同。在某個區域中,該值可能是五,而另一個區域中的值可能是十。這些配額的管理必須跨所有的相同服務、帳戶和區域,以在負載下提供一致的彈性。

在不同區域 (主動區域或被動區域) 間協調所有服務配額差異,並建立持續協調這類差異的程序。被動區域容錯移轉的測試計畫鮮少擴展至尖峰主動容量,意即演練日或桌面演練可能找不到區域之間的服務配額差異,因而無法維持正確的限制。

服務配額漂移是指特定指定配額的服務配額限制在一個區域而非所有區域中發生變更的情況,這對於追蹤和評估非常重要。您應考慮在具有流量甚或雲端承載流量的區域中變更配額。

  • 根據您的服務要求、延遲、法規和災難復原 (DR) 要求,選取相關的帳戶和區域。

  • 確定所有相關帳戶、區域和可用區域中的服務配額。限制範圍受限於帳戶和區域。您應比較這些值的差異。

實作步驟

  • 審查可能超出使用風險等級的 Service Quotas 值。超出 80% 和 90% 閾值時,AWS Trusted Advisor 會提供提醒。

  • 審查任何被動區域 (主動/被動設計中) 的服務配額值。確認在主要區域失敗時,負載將可在次要區域中成功執行。

  • 自動評估相同帳戶中的區域之間是否發生了任何服務配額漂移,並採取因應措施以變更限制。

  • 如果客戶的組織單位 (OU) 是以支援的方式建構的,則應更新服務配額範本,以反映應套用至多個區域和帳戶的任何配額中的變更。

    • 建立範本,並將區域關聯至配額變更。

    • 審查所有現有的服務配額範本,確認是否有任何必要的變更 (區域、限制和帳戶)。

資源

相關的最佳實務:

相關文件:

相關影片:

相關服務: