本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
為失敗狀態檢查的 Amazon EC2 執行個體建立 CloudWatch 警示
您可以使用狀態檢查測量結果來建立 CloudWatch 警示,以便在執行處理狀態檢查失敗時通知您。
重要
如果缺少指標資料點,狀態檢查和狀態檢查警示可能會暫時進入不足的資料狀態。雖然很少見,但是當指標報告系統發生中斷時,即使執行個體健康狀態良好,也可能發生這種情況。我們建議您將此狀態視為遺失資料,而非狀態檢查失敗或警示洩漏,尤其是在執行個體上執行停止、終止、重新開機或復原動作以回應時。
若要建立狀態檢查警示,請使用以下方法之一:
- Console
-
使用下列程序來設定警示,在執行個體的狀態檢查失敗時,透過電子郵件通知您、或者停止、終止或回復執行個體。
建立狀態檢查警示
在打開 Amazon EC2 控制台https://console.aws.amazon.com/ec2/
。 -
在導覽窗格中,選擇 Instances (執行個體)。
-
選取執行個體,選擇狀態檢查標籤,然後選擇動作 > 建立狀態檢查警示。
-
在 [管理 CloudWatch 鬧鐘] 頁面的 [新增或編輯鬧鐘] 底下,選擇 [建立鬧鐘]。
-
對於警示通知,請開啟開關以設定 Amazon 簡單通知服務 (AmazonSNS) 通知。選取現有的 Amazon SNS 主題或輸入名稱以建立新主題。
如果您在收件人清單中新增電子郵件地址或建立新主題,Amazon SNS 會向每個新地址傳送訂閱確認電子郵件訊息。每個收件人都必須選擇該訊息中包含的連結以確認訂閱。僅會寄送提醒通知至確認過的地址。
-
針對警示動作,開啟切換開關,以指定觸發警示時要採取的動作。選取動作。
-
針對 Alarm thresholds (警示閾值),指定警示的指標和準則。
您可以保留 Group samples by (分組範例條件) (Average (平均)) 和 Type of data to sample (要作為範例的資料類型) (Status check failed:either (狀態檢查失敗:其中一個)) 的預設設定,或者您可以根據您的需求進行變更。
針對連續期間,設定要評估的期間數,然後在期間中,輸入在觸發提醒及傳送電子郵件前的評估期間長度。
-
(選用) 針對 Sample metric data (範例指標資料),選擇 Add to dashboard (新增至儀表板)。
-
選擇 Create (建立)。
若您需要對執行個體狀態警示進行任何變更,您可以編輯它。
編輯狀態檢查警示
在打開 Amazon EC2 控制台https://console.aws.amazon.com/ec2/
。 -
在導覽窗格中,選擇 Instances (執行個體)。
-
選取執行個體並選擇 [動作]、[監控]、[管理 CloudWatch 警示]
-
在 [管理 CloudWatch 鬧鐘] 頁面的 [新增或編輯鬧鐘] 底下,選擇 [編輯鬧鐘]。
-
針對 Search for alarm (搜尋警示),選擇警示。
-
完成變更後,請選擇 Update (更新)。
- Command line
-
在下列範例中,當執行個體檢查失敗或系統狀態檢查至少兩個連續期間時
arn:aws:sns:us-west-2:111122223333:my-sns-topic
,警示會向SNS主題發出通知。使用的 CloudWatch 量度為StatusCheckFailed
。若要使用建立狀態檢查警示 AWS CLI
-
選取現有SNS主題或建立新主題。如需詳細資訊,請參閱使 AWS CLI 用AWS Command Line Interface 者指南SNS中的搭配 Amazon 使用。
-
使用以下列表指標命令查看 Amazon 的可用 Amazon 指 CloudWatch 標。EC2
aws cloudwatch list-metrics --namespace AWS/EC2
-
使用下列put-metric-alarm指令建立鬧鐘。
aws cloudwatch put-metric-alarm \ --alarm-name
StatusCheckFailed-Alarm-for-i-1234567890abcdef0
\ --metric-name StatusCheckFailed \ --namespace AWS/EC2 \ --statistic Maximum \ --dimensions Name=InstanceId,Value=i-1234567890abcdef0
\ --unit Count \ --period 300 \ --evaluation-periods 2 \ --threshold 1 \ --comparison-operator GreaterThanOrEqualToThreshold \ --alarm-actionsarn:aws:sns:us-west-2:111122223333:my-sns-topic
此期間是收集 Amazon CloudWatch 指標的時間範圍 (以秒為單位)。此範例使用 300,即 60 秒乘以 5 分鐘。評估期間為針對指標的值與閾值進行比較的連續期間數。此範例使用 2。警示動作為觸發此警示時要執行的動作。此範例會將警示設定為使用 Amazon 傳送電子郵件。SNS
-