為失敗狀態檢查的 Amazon EC2 執行個體建立 CloudWatch 警示 - Amazon Elastic Compute Cloud

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

為失敗狀態檢查的 Amazon EC2 執行個體建立 CloudWatch 警示

您可以使用狀態檢查測量結果來建立 CloudWatch 警示,以便在執行處理狀態檢查失敗時通知您。

重要

如果缺少指標資料點,狀態檢查和狀態檢查警示可能會暫時進入不足的資料狀態。雖然很少見,但是當指標報告系統發生中斷時,即使執行個體健康狀態良好,也可能發生這種情況。我們建議您將此狀態視為遺失資料,而非狀態檢查失敗或警示洩漏,尤其是在執行個體上執行停止、終止、重新開機或復原動作以回應時。

若要建立狀態檢查警示,請使用以下方法之一:

Console

使用下列程序來設定警示,在執行個體的狀態檢查失敗時,透過電子郵件通知您、或者停止、終止或回復執行個體。

建立狀態檢查警示
  1. 在打開 Amazon EC2 控制台https://console.aws.amazon.com/ec2/

  2. 在導覽窗格中,選擇 Instances (執行個體)。

  3. 選取執行個體,選擇狀態檢查標籤,然後選擇動作 > 建立狀態檢查警示

  4. 在 [管理 CloudWatch 鬧鐘] 頁面的 [新增或編輯鬧鐘] 底下,選擇 [建立鬧鐘]。

  5. 對於警示通知,請開啟開關以設定 Amazon 簡單通知服務 (AmazonSNS) 通知。選取現有的 Amazon SNS 主題或輸入名稱以建立新主題。

    如果您在收件人清單中新增電子郵件地址或建立新主題,Amazon SNS 會向每個新地址傳送訂閱確認電子郵件訊息。每個收件人都必須選擇該訊息中包含的連結以確認訂閱。僅會寄送提醒通知至確認過的地址。

  6. 針對警示動作,開啟切換開關,以指定觸發警示時要採取的動作。選取動作。

  7. 針對 Alarm thresholds (警示閾值),指定警示的指標和準則。

    您可以保留 Group samples by (分組範例條件) (Average (平均)) 和 Type of data to sample (要作為範例的資料類型) (Status check failed:either (狀態檢查失敗:其中一個)) 的預設設定,或者您可以根據您的需求進行變更。

    針對連續期間,設定要評估的期間數,然後在期間中,輸入在觸發提醒及傳送電子郵件前的評估期間長度。

  8. (選用) 針對 Sample metric data (範例指標資料),選擇 Add to dashboard (新增至儀表板)

  9. 選擇 Create (建立)。

若您需要對執行個體狀態警示進行任何變更,您可以編輯它。

編輯狀態檢查警示
  1. 在打開 Amazon EC2 控制台https://console.aws.amazon.com/ec2/

  2. 在導覽窗格中,選擇 Instances (執行個體)。

  3. 選取執行個體並選擇 [動作]、[監控]、[管理 CloudWatch 警示]

  4. 在 [管理 CloudWatch 鬧鐘] 頁面的 [新增或編輯鬧鐘] 底下,選擇 [編輯鬧鐘]。

  5. 針對 Search for alarm (搜尋警示),選擇警示。

  6. 完成變更後,請選擇 Update (更新)

Command line

在下列範例中,當執行個體檢查失敗或系統狀態檢查至少兩個連續期間時arn:aws:sns:us-west-2:111122223333:my-sns-topic,警示會向SNS主題發出通知。使用的 CloudWatch 量度為StatusCheckFailed

若要使用建立狀態檢查警示 AWS CLI
  1. 選取現有SNS主題或建立新主題。如需詳細資訊,請參閱使 AWS CLI 用AWS Command Line Interface 者指南SNS中的搭配 Amazon 使用。

  2. 使用以下列表指標命令查看 Amazon 的可用 Amazon 指 CloudWatch 標。EC2

    aws cloudwatch list-metrics --namespace AWS/EC2
  3. 使用下列put-metric-alarm指令建立鬧鐘。

    aws cloudwatch put-metric-alarm \ --alarm-name StatusCheckFailed-Alarm-for-i-1234567890abcdef0 \ --metric-name StatusCheckFailed \ --namespace AWS/EC2 \ --statistic Maximum \ --dimensions Name=InstanceId,Value=i-1234567890abcdef0 \ --unit Count \ --period 300 \ --evaluation-periods 2 \ --threshold 1 \ --comparison-operator GreaterThanOrEqualToThreshold \ --alarm-actions arn:aws:sns:us-west-2:111122223333:my-sns-topic

    此期間是收集 Amazon CloudWatch 指標的時間範圍 (以秒為單位)。此範例使用 300,即 60 秒乘以 5 分鐘。評估期間為針對指標的值與閾值進行比較的連續期間數。此範例使用 2。警示動作為觸發此警示時要執行的動作。此範例會將警示設定為使用 Amazon 傳送電子郵件。SNS