상태 확인에 실패한 Amazon EC2 인스턴스에 대한 CloudWatch 경보 생성
상태 확인 지표를 사용하여 인스턴스에 실패한 상태 확인이 있을 때 알리는 CloudWatch 경보를 생성할 수 있습니다.
중요
누락된 지표 데이터 요소가 있는 경우 상태 검사 및 상태 검사 경보가 일시적으로 데이터 부족 상태로 전환될 수 있습니다. 드물기는 하지만, 지표 보고 시스템이 중단되면 인스턴스가 정상인 경우에도 이 문제가 발생할 수 있습니다. 특히 이에 대응하여 인스턴스에 대한 중지, 종료, 재부팅 또는 복구 작업을 수행할 때는 이 상태를 상태 검사 실패나 경보 위반이 아닌 데이터 누락으로 취급하는 것이 좋습니다.
다음 방법 중 하나를 사용하여 상태 확인 경보 생성:
- Console
-
다음 절차에 따라 상태 확인에 실패할 때 이메일을 통해 알림을 전송하거나 인스턴스를 중지, 종료 또는 복구하는 경보를 구성합니다.
상태 확인 경보를 생성하는 방법
https://console.aws.amazon.com/ec2/
에서 Amazon EC2 콘솔을 엽니다. -
탐색 창에서 인스턴스를 선택합니다.
-
인스턴스를 선택하고, 상태 검사(Status Checks) 탭을 선택한 후 작업(Actions), 상태 검사 경보 생성(Create status check alarm)을 선택합니다.
-
[CloudWatch 경보 관리(Manage CloudWatch alarms)] 페이지의 [경보 추가 또는 편집(Add or edit alarm)]에서 [경보 생성(Create an alarm)]을 선택합니다.
-
경보 알림(Alarm notification)에서 토글을 켜서 Amazon Simple Notification Service(Amazon SNS) 알림을 구성합니다. 기존 Amazon SNS 주제를 선택하거나 이름을 입력하여 새 주제를 생성합니다.
수신자 목록에 이메일 주소를 추가했거나 새 주제를 만든 경우 Amazon SNS에서는 각각의 새 주소로 가입 확인 이메일을 보냅니다. 모든 수신자는 각각 이메일에 포함된 링크를 선택하여 가입 여부를 확인해야 합니다. 경고 알림은 확인된 주소로만 전송됩니다.
-
경보 작업(Alarm action)에서 토글을 켜서 경보가 트리거될 때 수행할 작업을 지정합니다. 작업을 선택합니다.
-
[경보 임계값(Alarm thresholds)]에서 경보에 대한 지표와 기준을 선택합니다.
샘플 그룹화 기준(Group samples by)(평균(Average)) 및 샘플링할 데이터 유형(Type of data to sample)(상태 확인 실패: 모두(Status check failed:either))을 기본 설정으로 두거나 요구 사항에 적합하게 변경할 수 있습니다.
[연속 기간(Consecutive Period)]에서 평가 주기의 개수를 설정하고 [기간(Period)]에서 경보가 실행되고 이메일 전송이 이루어지기 전에 적용할 평가 주기의 시간 단위를 설정합니다.
-
(선택 사항) 샘플 지표 데이터의 경우 대시보드에 추가를 선택합니다.
-
생성(Create)을 선택합니다.
필요한 경우 인스턴스 상태 경보를 수정할 수 있습니다.
상태 확인 경보를 편집하는 방법
https://console.aws.amazon.com/ec2/
에서 Amazon EC2 콘솔을 엽니다. -
탐색 창에서 인스턴스를 선택합니다.
-
인스턴스를 선택하고 작업, 모니터링, CloudWatch 경보 관리를 차례로 선택합니다.
-
[CloudWatch 경보 관리(Manage CloudWatch alarms)] 페이지의 [경보 추가 또는 편집(Add or edit alarm)]에서 [경보 편집(Edit an alarm)]을 선택합니다.
-
[경보 검색(Search for alarm)]에서 경보를 선택합니다.
-
변경을 마치면 [업데이트(Update)]를 선택합니다.
- Command line
-
다음은 인스턴스에서 연속으로 2주기 이상 인스턴스 검사 또는 시스템 상태 확인이 중단되면서 경보가 발생하여 SNS 주제인
arn:aws:sns:us-west-2:111122223333:my-sns-topic
에 대한 알림 메시지를 게시하는 예제입니다. 사용된 CloudWatch 지표는StatusCheckFailed
입니다.AWS CLI를 사용해 상태 확인 경보를 생성하려면
-
기존의 SNS 주제를 선택하거나 새로운 주제를 생성합니다. 자세한 내용은 AWS Command Line Interface 사용 설명서에서 Amazon SNS에서 AWS CLI 사용을 참조하세요.
-
아래와 같이 list-metrics 명령을 사용하여 Amazon EC2에 유효한 Amazon CloudWatch 지표를 확인합니다.
aws cloudwatch list-metrics --namespace AWS/EC2
-
아래와 같이 put-metric-alarm 명령을 사용하여 경보를 생성합니다.
aws cloudwatch put-metric-alarm \ --alarm-name
StatusCheckFailed-Alarm-for-i-1234567890abcdef0
\ --metric-name StatusCheckFailed \ --namespace AWS/EC2 \ --statistic Maximum \ --dimensions Name=InstanceId,Value=i-1234567890abcdef0
\ --unit Count \ --period 300 \ --evaluation-periods 2 \ --threshold 1 \ --comparison-operator GreaterThanOrEqualToThreshold \ --alarm-actionsarn:aws:sns:us-west-2:111122223333:my-sns-topic
기간은 Amazon CloudWatch 지표가 수집되는 시간 프레임(초)입니다. 이 예제에서는 60초와 5분을 곱셈하여 300초를 사용합니다. 평가 기간은 지표 값을 임계값과 비교해야 하는 연속 기간의 수입니다. 이 예제에서는 2를 사용합니다. 경보 작업은 경보가 트리거될 때 수행할 작업입니다. 이 예제에서는 Amazon SNS를 사용해 이메일을 보낼 수 있도록 경보를 구성합니다.
-