REL07-BP03 偵測到工作負載需要更多資源時取得資源 - 可靠性支柱

REL07-BP03 偵測到工作負載需要更多資源時取得資源

主動擴展資源以滿足需求並避免可用性影響。

許多 AWS 服務會自動調整規模以滿足需求。如果使用 Amazon EC2 執行個體或 Amazon ECS 叢集,您可以將這些叢集的自動調整規模功能設定為根據與工作負載需求對應之用量指標來執行。對於 Amazon EC2,平均 CPU 使用率、負載平衡器請求計數或網路頻寬可用於擴展 (或縮減) EC2 執行個體。對於 Amazon ECS,平均 CPU 使用率、負載平衡器請求計數和記憶體使用率可用於橫向擴展 (或縮減) ECS 任務。透過在 AWS 上使用 Target Auto Scaling,自動調整規模裝置的作用就像家用恆溫器一樣,可新增或移除資源以維持您指定的目標值 (例如,70% 的 CPU 使用率)。

AWS Auto Scaling 也可以執行 Predictive Auto Scaling,其會使用機器學習分析每個資源的歷史工作負載,並定期預測未來兩天的未來負載。

「利特爾法則」有助於計算您需要的運算執行個體 (EC2 執行個體、並行 Lambda 函數等) 的數量。

L = λW

L = 執行個體數量 (或系統中的平均並行)

λ = 請求到達時的平均速率 (請求/秒)

W = 每個請求在系統中花費的平均時間 (秒)

例如,在 100 rps 時,如果每個請求需要 0.5 秒才能處理,您就需要 50 個執行個體才能因應需求。

若未建立此最佳實務,暴露的風險等級為:

實作指引

資源

相關文件: