根據連線的資料來源建立警示 - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

根據連線的資料來源建立警示

您可以建立警示,從不在 中的資料來源觀看指標 CloudWatch。如需有關建立其他資料來源連線的詳細資訊,請參閱 從其他資料來源中查詢指標

若要從已連線的資料來源建立指標警示
  1. 在 開啟 CloudWatch 主控台https://console.aws.amazon.com/cloudwatch/

  2. 在導覽窗格中,選擇 Metrics (指標)、All metrics (所有指標)。

  3. 選擇多來源查詢索引標簽。

  4. 對於資料來源,選取您想要使用的資料來源。

  5. 查詢建置器會提示您輸入查詢所需的資訊,以擷取用於警示的指標。每個資料來源的工作流程都不同,並針對資料來源量身打造。例如,對於 Amazon Managed Service for Prometheus 和 Prometheus 資料來源,則會出現一個包含查詢協助程式的 PromQL 查詢編輯器方塊。

  6. 完成查詢的建構後,請選擇圖形查詢

  7. 如果範例圖表看起來符合您的預期,請選擇建立警示

  8. 指定指標和條件頁面出現。如果使用的查詢產生多個時間序列,將會在頁面頂部看到警告橫幅。如果您這樣做,請選取一個函數,用於彙總彙總函數中的時間序列。

  9. (選用) 新增警示標籤

  10. 無論何時 your-metric-name 是 . . .,選擇 大/相等 低/相等 。對於相比…,為閾值指定一個數字。

  11. 選擇 Additional configuration (其他組態)。針對 Datapoints to alarm (要警示的資料點),請指定 (資料點) 必須處於 ALARM 狀態多少評估期間,才會觸發警示。如果此處的兩個值相符,您便可以建立警示,在許多連續期間違規時移至 ALARM 狀態。

    若要建立 N 個中有 M 個警示,請針對小於第二個值之數字的第一個值指定數字。如需詳細資訊,請參閱評估警示

  12. 對於 Missing data treatment (遺失資料處理方式),選擇警示在遺失某些資料點時的行為。如需詳細資訊,請參閱設定 CloudWatch 警示處理遺失資料的方式

  13. 選擇 Next (下一步)

  14. 針對通知 ,指定警示轉換為 ALARMOKINSUFFICIENT_DATA 狀態時要通知的 Amazon SNS主題。

    1. (選用) 若要針對相同警示狀態或不同警示狀態傳送多個通知,請選擇 Add notification (新增通知)。

      注意

      建議您設定警示,以便除了在進入警示狀態外,進入資料不足狀態時應採取動作。這是因為連線至資料來源的 Lambda 函數有許多問題可能會導致警示轉換為資料不足

    2. (選用) 若要不傳送 Amazon SNS通知,請選擇移除

  15. 若要讓警示執行 Auto Scaling 、、EC2Lambda 或 Systems Manager 動作,請選擇適當的按鈕,然後選擇要執行的警示狀態和動作。如果您選擇 Lambda 函數作為警示動作,您可以指定函數名稱或 ARN,也可以選擇函數的特定版本。

    警示只能在進入 ALARM 狀態時執行 Systems Manager 動作。如需 Systems Manager 動作的詳細資訊,請參閱設定 CloudWatch 以 OpsItems 從警示建立事件建立

    注意

    若要建立執行 SSM Incident Manager 動作的警示,您必須具有特定許可。如需詳細資訊,請參閱 AWS Systems Manager Incident Manager 的身分型政策範例

  16. 選擇 Next (下一步)

  17. Name and description (名稱和描述) 下,輸入警示的名稱和描述,然後選擇 Next (下一步)。名稱只能包含 UTF-8 個字元,且不能包含ASCII控制字元。描述可以包括降價格式,這只會顯示在 CloudWatch 主控台的警示詳細資訊索引標籤中。Markdown 對於將連結新增至執行手冊或其他內部資源很實用。

    提示

    警示名稱只能包含 UTF-8 個字元。它不能包含ASCII控制字元。

  18. Preview and create (預覽及建立) 下,請確認警示資訊和條件都是正確的,然後選擇 Create alarm (建立警示)。

已連線資料來源的警示詳細資訊

  • 當 CloudWatch 評估警示時,即使警示的期間超過一分鐘,每分鐘也會這樣做。若要讓警示運作,Lambda 函數必須能夠傳回從任何一分鐘開始的時間戳記清單,而不僅是週期長度的倍數。這些時間戳記必須相隔一個週期長度。

    因此,如果 Lambda 查詢的資料來源只能傳回週期長度倍數的時間戳記,則函數應「重新取樣」擷取的資料,以符合 GetMetricData 請求所預期的時間戳記。

    例如,使用每次偏移一分鐘的五分鐘時段,每分鐘評估一次週期為五分鐘的警示。在此案例中:

    • 對於 12:15:00 的警示評估, CloudWatch 會預期時間戳記為 12:00:0012:05:00和 的資料點12:10:00

    • 然後,對於 12:16:00 的警示評估, CloudWatch 會預期具有 12:01:0012:06:00和 時間戳記的資料點12:11:00

  • 當 CloudWatch 評估警示時,Lambda 函數傳回的任何與預期時間戳記不相符的資料點都會捨棄,並使用剩餘的預期資料點評估警示。例如,在 12:15:00 評估警示時,它預期資料具有 12:00:0012:05:0012:10:00 時間戳記。如果其接收的時間戳記為 12:00:0012:06:0012:05:00和 的資料12:10:00,則會12:06:00捨棄來自 的資料,並使用其他時間戳記 CloudWatch 評估警示。

    然後,對於在 12:16:00 進行的下一次評估,它預期資料具有 12:01:0012:06:0012:11:00 時間戳記。如果它只有時間戳記為 12:00:0012:05:0012:10:00 的資料,則所有這些資料點都會在 12:16:00 被忽略,並且警示會根據您指定該警示來處理遺失資料的方式轉換為相應狀態。如需詳細資訊,請參閱評估警示

  • 建議您建立這些警示,以便在它們轉換為 INSUFFICIENT_DATA 狀態時採取動作,因為多個 Lambda 函數失敗使用案例都會將警示轉換為 INSUFFICIENT_DATA,無論您設定警示以何種方式處理遺失的資料。

  • 如果 Lambda 函數傳回錯誤或傳回部分資料:

    • 如果呼叫 Lambda 函數時發生許可問題,警示會開始遺失資料轉換,其依據為您指定該警示在建立時處理遺失資料的方式。

    • 如果 Lambda 函數傳回 'StatusCode' = 'PartialData',則警示評估失敗,並且警示在嘗試三次後轉換為 INSUFFICIENT_DATA,這大約需要三分鐘。

    • 任何來自 Lambda 函數的其他錯誤都會導致警示轉換為 INSUFFICIENT_DATA

  • 如果 Lambda 函數請求的指標有一些延遲,從而導致最後一個資料點永遠遺失,您應採取因應措施。可以建立「N 中取 M」警示,或增加警示的評估時間。如需「N 中取 M」警示的詳細資訊,請參閱 評估警示