建立CPU用量警示 - Amazon CloudWatch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

建立CPU用量警示

您可以建立 CloudWatch 警示,在警示狀態從 變更為 SNS時,使用 Amazon OK 傳送通知ALARM

當EC2執行個體的平均CPU使用量連續指定期間超過指定的閾值時,警示會變更為 ALARM 狀態。

使用 設定CPU用量警示 AWS Management Console

使用這些步驟來使用 AWS Management Console 建立CPU用量警示。

根據CPU用量建立警示
  1. 在 開啟 CloudWatch 主控台https://console.aws.amazon.com/cloudwatch/

  2. 在導覽窗格中,選擇 Alarms (警示)、All alarms (所有警示)。

  3. 選擇 Create alarm (建立警示)。

  4. 選擇 Select metric (選取指標)。

  5. 在所有指標索引標籤中,選擇EC2指標

  6. 選擇指標類別 (例如,Per-Instance Metrics (每個執行個體指標))。

  7. 尋找包含您想要在資料InstanceId欄和指標名稱資料欄中列出之執行個體CPUUtilization的資料列。選取此資料列旁的核取方塊,然後選擇 Select metric (選取指標)

  8. Specify metric and conditions (指定指標和條件) 下,針對 Statistic (統計資訊),選擇 Average (平均),選擇其中一個預先定義的百分位數,或指定自訂的百分位數 (例如 p95.45)。

  9. 選擇期間 (例如,5 minutes)。

  10. Conditions (條件) 下,指定以下內容:

    1. 對於閾值類型,選擇靜態

    2. 對於任何時候CPUUtilization為 ,請指定更大的 。在低於...的情況下,指定如果CPU使用率超過此百分比,將觸發警示進入ALARM狀態的閾值。例如:70。

    3. 選擇 Additional configuration (其他組態)。針對 Datapoints to alarm (要警示的資料點),請指定 (資料點) 必須處於 ALARM 狀態多少評估期間,才會觸發警示。如果此處的兩個值相符,您便可以建立警示,在許多連續期間違規時移至 ALARM 狀態。

      若要建立 N 個中有 M 個警示,請針對第一個值,指定低於您為第二個值所指定值的值。如需詳細資訊,請參閱評估警示

    4. 針對 Missing data treatment (遺失資料處理),選擇警示在遺失某些資料點時的行為。如需詳細資訊,請參閱設定 CloudWatch 警示處理遺失資料的方式

    5. 若警示使用百分位數作為監控統計資料,則會出現一個 Percentiles with low samples (低樣本的百分位數) 方塊。請使用它來選擇是要評估還是忽略具有低抽樣率的案例。若您選擇 ignore (maintain alarm state) (忽略 (維持警示狀態)),則會在抽樣大小過低時一律維持目前的警示狀態。如需詳細資訊,請參閱以百分位數為基礎的 CloudWatch 警示和低資料範例

  11. 選擇 Next (下一步)

  12. 通知 下,選擇在警示中,然後選取警示處於ALARM狀態時要通知SNS的主題

    若要讓警示針對相同的警示狀態或不同警示狀態傳送多個通知,請選擇 Add notification (新增通知)

    若要讓警示不傳送通知,請選擇 Remove (移動)

  13. 完成時,請選擇下一步

  14. 輸入警示的名稱與說明。然後選擇下一步

    名稱只能包含 UTF-8 個字元,且不能包含ASCII控制字元。描述可以包含降價格式,這只會顯示在 CloudWatch 主控台的警示詳細資訊索引標籤中。Markdown 對於將連結新增至執行手冊或其他內部資源很實用。

  15. Preview and create (預覽及建立) 下,請確認資訊和條件都是您希望的內容,然後選擇 Create alarm (建立警示)

使用 設定CPU用量警示 AWS CLI

使用這些步驟來使用 AWS CLI 建立CPU用量警示。

根據CPU用量建立警示
  1. 設定 SNS 主題。如需詳細資訊,請參閱設定 Amazon SNS通知

  2. 使用 put-metric-alarm命令建立警示,如下所示。

    aws cloudwatch put-metric-alarm --alarm-name cpu-mon --alarm-description "Alarm when CPU exceeds 70%" --metric-name CPUUtilization --namespace AWS/EC2 --statistic Average --period 300 --threshold 70 --comparison-operator GreaterThanThreshold --dimensions Name=InstanceId,Value=i-12345678 --evaluation-periods 2 --alarm-actions arn:aws:sns:us-east-1:111122223333:my-topic --unit Percent
  3. 使用 set-alarm-state命令強制執行警示狀態變更來測試警示。

    1. 將警示的狀態從 INSUFFICIENT_DATA 變更為 OK

      aws cloudwatch set-alarm-state --alarm-name cpu-mon --state-reason "initializing" --state-value OK
    2. 將警示的狀態從 OK 變更為 ALARM

      aws cloudwatch set-alarm-state --alarm-name cpu-mon --state-reason "initializing" --state-value ALARM
    3. 確認您已收到一封與警示相關的通知。