本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 Amazon Aurora 叢集中監控指標
Amazon Aurora 會使用複寫的資料庫伺服器叢集。通常,監控 Aurora 叢集需要檢查多個資料庫執行個體的運作狀態。這些執行個體可能具有專業的角色,這些角色通常會處理寫入操作、唯讀操作或兩者的組合。您也可以透過測量複寫延遲,來監控叢集的整體運作狀態。這是一個資料庫執行個體所做變更可供其他執行個體使用的持續時間。
主題
監控計畫
在開始監控 極光之前,請先創建一個監控計劃。此計畫應該回答下列問題:
-
監控目標是什麼?
-
監控哪些資源?
-
監控這些資源的頻率為何?
-
將使用哪些監控工具?
-
誰將執行監控任務?
-
發生問題時應該通知誰?
效能基準
若要達到監控目標,您需要建立一個基準。為此,請在 Aurora 環境中不同時間在不同負載條件下測量效能。您可以監控如下所示的指標:
-
網路輸送量
-
用戶端連線
-
用於讀取、寫入或中繼資料操作的 I/O
-
資料庫執行個體的爆量點數餘額
我們建議您存放 Aurora 的歷史績效資料。使用儲存的資料,您可以比較當前的效能與過去的趨勢。您也可以區分正常與異常的效能模式,並設計技術來解決問題。
效能指導方針
一般來說,效能指標的可接受值依據您應用程式相對於基準所執行的內容而定。調查距離基準的一致或趨勢變異。下列指標通常是效能問題的來源:
-
高CPU或RAM耗用量 — 如果符合您應用程式的目標 (例如輸送量CPU或並行) 且符合您預期的目標,則高值或RAM消費可能是適當的。
-
磁碟空間消耗量 – 如果使用的空間持續保持在等於或高於總磁碟空間的 85%,請調查磁碟空間消耗量。看看從執行個體刪除資料或將資料封存至不同的系統來釋出空間是否可行。
-
網路流量 – 對於網路流量,請洽系統管理員,以了解您的網域網路和網際網路連線預期的輸送量。調查網路流量的傳輸量是否如預期一致地降低。
-
資料庫連線 – 如果您看到大量使用者連線,同時執行個體效能下降且回應時間延長,請考慮限制資料庫連線。資料庫執行個體使用者連接的最佳數量,將因執行個體類別和要執行的操作複雜性而不同。若要判定資料庫連線的數目,方法是將資料庫執行個體與
User Connections
參數設為 0 (無限制) 以外之值的參數群組建立關聯。您可以使用現有的參數群組或建立新的參數群組。如需詳細資訊,請參閱Amazon Aurora 的參數組 RDS。 -
IOPS指標 — 測量結IOPS果的預期值取決於磁碟規格和伺服器組態,因此請使用您的基準來瞭解典型值。調查值是否與您的基準一致地不同。為了獲得最佳IOPS效能,請確保您的典型工作集適合記憶體,以將讀取和寫入作業降到最低。
當效能落在您建立的基準之外時,您可能需要進行變更,以最佳化工作負載的資料庫可用性。例如,您可能需要變更資料庫執行個體的執行個體類別。或者,您可能需要變更用戶端可用的資料庫執行個體和讀取複本的數目。