生產監控 - Amazon DynamoDB

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

生產監控

您應該透過測量不同時間和不同負載條件下的效能,為環境中的正常DAX效能建立基準。當您監控 時DAX,應考慮儲存歷史監控資料。這個存放的資料會提供基準,讓您與目前的效能資料比較,識別出正常的效能模式和效能異常狀況,再規劃方式來處理問題。

若要確立基準,您至少應在負載測試和生產階段監控下列項目。

  • CPU 使用率和限流請求,以便您判斷是否需要在叢集中使用較大的節點類型。叢集的使用率可透過 CPUUtilization CloudWatch 指標CPU取得。此指標的平均統計數字提供叢集中所有節點的平均CPU使用率檢視。對於叢集擴展決策,我們建議您使用最大 stat,這是所有節點的最大使用率。

    注意

    AWS 已改善CPUUtilization指標的精細度。您可能會觀察到指標從 2024-05-17 到 2024-06-22 的變更。

  • 操作延遲 (在用戶端測量) 應該保持在應用程式的延遲需求之內。

  • 錯誤率應保持低,如 FaultRequestCountErrorRequestCountFailedRequestCount CloudWatch 指標所示。

  • 網路位元組耗用,以便您判斷是否應該在叢集中使用更多節點或更大的節點類型。若要監控耗用,您可以針對 BaselineNetworkBytesInUtilization和 中的可用BaselineNetworkBytesOutUtilization指標設定警示 CloudWatch,分別表示執行個體類型可用的網路頻寬耗用百分比,以用於傳入和傳出流量。

  • 快取記憶體使用率和移出的大小,如此就能判斷叢集的節點類型是否有足夠的記憶體可保留您的工作集,若是不足,則切換至較大的節點類型。

    注意

    在大量快取遺漏和寫入的情況下,快取記憶體使用率可能增加達 100%,且可能造成可用性停擺。

  • 用戶端連接,可讓您監控叢集連接中任何無法解釋的峰值。