本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
您可以監控關鍵指標,例如快取命中率,以確保最佳的 DAX 叢集效能、診斷問題,以及判斷何時需要擴展叢集。定期檢查關鍵指標可協助您透過擴展叢集以符合工作負載需求,來維持效能、穩定性和成本效益。如需監控 DAX 的詳細資訊,請參閱生產監控。
下列清單顯示您應該監控的一些關鍵指標:
-
快取命中率 – 顯示 DAX 提供快取資料的效率,減少存取基礎 DynamoDB 資料表的需求。叢集很少快取遺漏表示快取效率良好。但是很少快取命中顯示您可能需要重新檢視快取 TTL 設定,否則工作負載不適合快取。
使用 Amazon CloudWatch 計算 DAX 叢集的快取命中率。比較
ItemCacheHits
、QueryCacheHits
、ItemCacheMisses
和QueryCacheMisses
指標以取得此比率。下列公式顯示如何計算快取命中率。若要使用此公式計算比率,請將快取命中數除以快取命中數和未命數的總和。Cache hit ratio = Cache hits / (Cache hits + Cache misses)
快取命中率是介於 0 和 1 之間的數字,以百分比表示。較高百分比表示整體快取使用率較佳。
-
ErrorRequestCount – 導致節點或叢集回報使用者錯誤的請求計數。
ErrorRequestCount
包含由節點或叢集調節的請求。監控使用者錯誤可協助您識別應用程式中的擴展設定錯誤或熱門項目/分割區模式。 -
操作延遲 – 監控讀取和寫入操作往返 DAX 叢集的延遲,可協助您識別效能瓶頸。增加延遲可能表示您的 DAX 叢集組態、網路或需要擴展的問題。
-
網路耗用 – 密切注意
NetworkBytesIn
和NetworkBytesOut
指標,以監控 DAX 叢集的網路流量。網路輸送量意外增加可能表示用戶端請求更多,或查詢模式效率不佳,導致傳輸更多資料。監控網路消耗量可協助您管理 DAX 叢集的成本。它還確保網路不會成為叢集效能的瓶頸。
-
移除率 – 顯示項目從快取中移除的頻率,以為新項目騰出空間。如果移出率隨時間增加,您的快取可能太小,或您的快取策略無效。
在 CloudWatch
EvictedSize
中監控指標,以判斷您的快取大小是否適合您的工作負載。如果總移出大小持續增加,您可能需要擴展 DAX 叢集,以容納更大的快取。 -
CPU 使用率 – 指節點或叢集的 CPU 使用率百分比。這是監控任何資料庫或快取系統的關鍵指標。高 CPU 使用率可能表示您的 DAX 叢集可能超載,且需要擴展才能處理增加的需求。
監控 DAX 叢集的
CPUUtilization
指標。如果您的 CPU 使用率持續接近或超過 70-80%,請考慮擴展您的 DAX 叢集,如下節所述。如果傳送至 DAX 的請求數量超過節點的容量,DAX 會限制接受其他請求的速率。它透過傳回 ThrottlingException 來執行此操作。DAX 會持續評估叢集的 CPU 使用率,以判斷其可處理的請求磁碟區,同時維持良好的叢集狀態。
您可以監控 DAX 發佈至 CloudWatch 的
ThrottledRequestCount
指標。如果您每隔一段時間就會看到這些例外狀況,請考慮擴展您的叢集。
使用監控資料擴展 DAX 叢集
您可以監控 DAX 叢集的效能指標,來判斷您是否需要向上或向下擴展 DAX 叢集。
-
向上擴展或向外擴展 – 如果您的 DAX 叢集具有高 CPU 使用率、低快取命中 (最佳化快取策略之後) 或高操作延遲,您應該擴展叢集。新增更多節點,也稱為向外擴展,有助於更平均地分配負載。對於每秒寫入增加的工作負載,您可能需要選擇更強大的節點 (向上擴展)。
-
縮減規模 – 如果您持續看到 CPU 使用率和操作延遲低於閾值,則可能會有過度佈建的資源。在這種情況下,請縮減節點以降低成本。您可以在低使用率期間將節點數量減少到 1,但無法完全關閉叢集。