使用 CloudWatch 異常偵測 - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 CloudWatch 異常偵測

當您啟用量度的異常偵測時,會 CloudWatch 套用統計和機器學習演算法。這些演算法會在使用者介入程度最低的情況下,持續分析系統和應用程式的指標、判斷正常基準以及表面異常情況。

演算法會產生異常偵測模型。模型會產生預期值範圍,代表正常指標行為。

您可以使用 AWS Management Console、、或 AWS SDK 啟用 AWS CLI異常偵測。 AWS CloudFormation您可以在提供的指標上啟用異常偵測,也可以針對自訂指標啟用異常偵測。 AWS 在設定為 CloudWatch 跨帳戶觀察性監視帳戶的帳戶中,除了監控帳戶中的指標之外,您還可以在來源帳戶中建立指標的異常偵測器。

您可以透過兩種方式來使用預期值的模型:

  • 建立以指標預期值為基礎的異常偵測警示。這些類型的警示沒有用於判斷警示狀態的靜態臨界值。相反地,它們會根據異常偵測模型,將指標值與預期值進行比較。

    您可以選擇警示觸發時機是在指標值超過預期值範圍、低於範圍,或者兩者同時發生時。

    如需詳細資訊,請參閱 根據異常偵測建立 CloudWatch 警示

  • 檢視指標資料圖表時,將預期值以區帶形式覆蓋到圖表上。這樣可以清楚地看出圖表中哪些值超出正常範圍。如需詳細資訊,請參閱 建立圖形

    您也可以使用含 ANOMALY_DETECTION_BAND 指標數學函數的 GetMetricData API 請求來擷取模型範圍的上下限值。如需詳細資訊,請參閱GetMetricData

在具有異常偵測的圖表中,預期值的範圍顯示為灰色區帶。如果指標的實際值超出此區帶,則在該時間內會顯示為紅色。

異常偵測演算法會考慮指標的季節性和趨勢變化。季節性變化可能是每小時、每日或每週,如下列範例所示。

指標主控台顯示為 CPUUtilization 指標啟用的異常偵測。
指標主控台顯示為 CPUUtilization 指標啟用的異常偵測。
指標主控台顯示為 CPUUtilization 指標啟用的異常偵測。

較長範圍的趨勢可能是向下或向上。

指標主控台顯示為 CPUUtilization 指標啟用的異常偵測。

異常偵測也適用於具有平面模式的指標。

指標主控台顯示為 CPUUtilization 指標啟用的異常偵測。

CloudWatch 異常偵測的運作方式

當您為量度啟用異常偵測時,會將機器學習演算法 CloudWatch 套用至量度的過去資料,以建立量度預期值的模型。模型會評估指標的趨勢以及每小時、每日和每週模式。演算法可以最多兩週的指標資料為目標,但即使指標沒有完整兩週的資料,您仍可以對指標啟用異常偵測。

您可以指定異常偵測臨界值的值,該臨界值會與模型一起 CloudWatch 使用,以決定量度的「正常」值範圍。較高的異常偵測臨界值會產生較厚的「正常」值範圍。

機器學習模型是指標和統計資料所特有的。例如,如果您使用 AVG 統計資料來啟用指標的異常偵測,此模型就是 AVG 統計資料所特有的。

從 AWS 服務 CloudWatch 建立許多常見度量的模型時,可確保頻帶不會延伸到邏輯值之外。例如,EC2 實例的頻段將保持在 0 和 100 之間,並且頻段跟踪 CloudFront Requests(不能為MemoryUtilization負數)永遠不會低於零。

建立模型之後, CloudWatch 異常偵測會持續評估模型並對其進行調整,以確保其盡可能準確。這包括重新訓練模型,以在指標隨時間變化或突然變更時對其進行調整,並包含預測器,可改善季節性、尖峰或稀疏的指標模型。

對指標啟用異常偵測後,您可以選擇排除指標的指定時段,避免這些時段被用於模型的訓練。如此一來,您就可以排除部署或其他不尋常事件,避免這些事件被用於模型的訓練,確保建立的模型是最準確的。

針對警示使用異常偵測模型,會對您 AWS 的帳戶產生費用。如需詳細資訊,請參閱 Amazon CloudWatch 定價

指標數學上的異常偵測

指標數學上的異常偵測是一項功能,您可使用此功能根據輸出指標數學表達式建立異常偵測警示。您可以使用這些表達式來建立可視化異常偵測頻段的圖形。此功能支援基本算術函數、比較和邏輯運算子,以及大多數其他函數。如需不受支援之函數的相關資訊,請參閱 Amazon 使用 CloudWatch 者指南中的使用指標數學運算

您可以根據指標數學表達式建立異常偵測模型,類似於建立異常偵測模型的方式。您可以從 CloudWatch 主控台將異常偵測套用至量度數學運算式,並選取異常偵測作為這些運算式的臨界值類型。

注意

只能在最新版的指標使用者介面中啟用和編輯指標數學的異常偵測。在新版介面中根據指標數學表達式建立異常偵測器時,您可以在舊版中進行檢視,但無法編輯。

如需如何為異常偵測和指標數學建立警示和模型的相關資訊,請參閱下列章節:

您也可以使用 CloudWatch API 搭配、和,根據度量數學運算式建立PutAnomalyDetectorDeleteAnomalyDetector刪除和DescribeAnomalyDetectors探索異常偵測模型。如需這些 API 動作的相關資訊,請參閱 Amazon CloudWatch API 參考中的以下各節。

如需異常偵測警示計價方式的詳細資訊,請參閱 Amazon CloudWatch 定價