本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
生產監控
您應在各個時間點和不同的負載條件下測量效能,以在您的環境中確立 DAX 正常效能的基準。當您監控 DAX 時,應該考慮存放歷史監控資料。這個存放的資料會提供基準,讓您與目前的效能資料比較,識別出正常的效能模式和效能異常狀況,再規劃方式來處理問題。
若要確立基準,您至少應在負載測試和生產階段監控下列項目。
-
CPU 使用率和節流請求,可讓您判斷是否需要在叢集中使用大型節點類型。您可透過
CPUUtilization
CloudWatch 指標取得叢集的 CPU 使用率。此指標的平均統計資料可提供叢集中所有節點的平均 CPU 使用率檢視。對於叢集擴展決策,我們建議您使用最大統計值,即所有節點的最大使用率。注意
AWS 已改善
CPUUtilization
量度的粒度。從 2024 年 5 月 17 日開始,您可能會觀察到指標的變更。 -
操作延遲 (在用戶端測量) 應該保持在應用程式的延遲需求之內。
-
錯誤率應該保持較低,如
ErrorRequestCount
FaultRequestCount
、和FailedRequestCount
CloudWatch 指標所示。 -
網路位元組耗用量,因此您可以判斷叢集中是否應該使用更多節點或更大的節點類型。若要監控使用情況,您可以在中設定警示
BaselineNetworkBytesInUtilization
和可用指BaselineNetworkBytesOutUtilization
標 CloudWatch,指出執行個體類型的可用網路頻寬耗用百分比,分別針對輸入和輸出流量。 -
快取記憶體使用率和移出的大小,如此就能判斷叢集的節點類型是否有足夠的記憶體可保留您的工作集,若是不足,則切換至較大的節點類型。
注意
在大量快取遺漏和寫入的情況下,快取記憶體使用率可能增加達 100%,且可能造成可用性停擺。
-
用戶端連接,可讓您監控叢集連接中任何無法解釋的峰值。