상태 확인에 실패한 Amazon EC2 인스턴스에 대한 CloudWatch 경보 생성 - Amazon Elastic Compute Cloud

상태 확인에 실패한 Amazon EC2 인스턴스에 대한 CloudWatch 경보 생성

상태 확인 지표를 사용하여 인스턴스에 실패한 상태 확인이 있을 때 알리는 CloudWatch 경보를 생성할 수 있습니다.

중요

누락된 지표 데이터 요소가 있는 경우 상태 검사 및 상태 검사 경보가 일시적으로 데이터 부족 상태로 전환될 수 있습니다. 드물기는 하지만, 지표 보고 시스템이 중단되면 인스턴스가 정상인 경우에도 이 문제가 발생할 수 있습니다. 특히 이에 대응하여 인스턴스에 대한 중지, 종료, 재부팅 또는 복구 작업을 수행할 때는 이 상태를 상태 검사 실패나 경보 위반이 아닌 데이터 누락으로 취급하는 것이 좋습니다.

다음 방법 중 하나를 사용하여 상태 확인 경보 생성:

Console

다음 절차에 따라 상태 확인에 실패할 때 이메일을 통해 알림을 전송하거나 인스턴스를 중지, 종료 또는 복구하는 경보를 구성합니다.

상태 확인 경보를 생성하는 방법
  1. https://console.aws.amazon.com/ec2/에서 Amazon EC2 콘솔을 엽니다.

  2. 탐색 창에서 인스턴스를 선택합니다.

  3. 인스턴스를 선택하고, 상태 검사(Status Checks) 탭을 선택한 후 작업(Actions), 상태 검사 경보 생성(Create status check alarm)을 선택합니다.

  4. [CloudWatch 경보 관리(Manage CloudWatch alarms)] 페이지의 [경보 추가 또는 편집(Add or edit alarm)]에서 [경보 생성(Create an alarm)]을 선택합니다.

  5. 경보 알림(Alarm notification)에서 토글을 켜서 Amazon Simple Notification Service(Amazon SNS) 알림을 구성합니다. 기존 Amazon SNS 주제를 선택하거나 이름을 입력하여 새 주제를 생성합니다.

    수신자 목록에 이메일 주소를 추가했거나 새 주제를 만든 경우 Amazon SNS에서는 각각의 새 주소로 가입 확인 이메일을 보냅니다. 모든 수신자는 각각 이메일에 포함된 링크를 선택하여 가입 여부를 확인해야 합니다. 경고 알림은 확인된 주소로만 전송됩니다.

  6. 경보 작업(Alarm action)에서 토글을 켜서 경보가 트리거될 때 수행할 작업을 지정합니다. 작업을 선택합니다.

  7. [경보 임계값(Alarm thresholds)]에서 경보에 대한 지표와 기준을 선택합니다.

    샘플 그룹화 기준(Group samples by)(평균(Average)) 및 샘플링할 데이터 유형(Type of data to sample)(상태 확인 실패: 모두(Status check failed:either))을 기본 설정으로 두거나 요구 사항에 적합하게 변경할 수 있습니다.

    [연속 기간(Consecutive Period)]에서 평가 주기의 개수를 설정하고 [기간(Period)]에서 경보가 실행되고 이메일 전송이 이루어지기 전에 적용할 평가 주기의 시간 단위를 설정합니다.

  8. (선택 사항) 샘플 지표 데이터의 경우 대시보드에 추가를 선택합니다.

  9. 생성(Create)을 선택합니다.

필요한 경우 인스턴스 상태 경보를 수정할 수 있습니다.

상태 확인 경보를 편집하는 방법
  1. https://console.aws.amazon.com/ec2/에서 Amazon EC2 콘솔을 엽니다.

  2. 탐색 창에서 인스턴스를 선택합니다.

  3. 인스턴스를 선택하고 작업, 모니터링, CloudWatch 경보 관리를 차례로 선택합니다.

  4. [CloudWatch 경보 관리(Manage CloudWatch alarms)] 페이지의 [경보 추가 또는 편집(Add or edit alarm)]에서 [경보 편집(Edit an alarm)]을 선택합니다.

  5. [경보 검색(Search for alarm)]에서 경보를 선택합니다.

  6. 변경을 마치면 [업데이트(Update)]를 선택합니다.

Command line

다음은 인스턴스에서 연속으로 2주기 이상 인스턴스 검사 또는 시스템 상태 확인이 중단되면서 경보가 발생하여 SNS 주제인 arn:aws:sns:us-west-2:111122223333:my-sns-topic에 대한 알림 메시지를 게시하는 예제입니다. 사용된 CloudWatch 지표는 StatusCheckFailed입니다.

AWS CLI를 사용해 상태 확인 경보를 생성하려면
  1. 기존의 SNS 주제를 선택하거나 새로운 주제를 생성합니다. 자세한 내용은 AWS Command Line Interface 사용 설명서에서 Amazon SNS에서 AWS CLI 사용을 참조하세요.

  2. 아래와 같이 list-metrics 명령을 사용하여 Amazon EC2에 유효한 Amazon CloudWatch 지표를 확인합니다.

    aws cloudwatch list-metrics --namespace AWS/EC2
  3. 아래와 같이 put-metric-alarm 명령을 사용하여 경보를 생성합니다.

    aws cloudwatch put-metric-alarm \ --alarm-name StatusCheckFailed-Alarm-for-i-1234567890abcdef0 \ --metric-name StatusCheckFailed \ --namespace AWS/EC2 \ --statistic Maximum \ --dimensions Name=InstanceId,Value=i-1234567890abcdef0 \ --unit Count \ --period 300 \ --evaluation-periods 2 \ --threshold 1 \ --comparison-operator GreaterThanOrEqualToThreshold \ --alarm-actions arn:aws:sns:us-west-2:111122223333:my-sns-topic

    기간은 Amazon CloudWatch 지표가 수집되는 시간 프레임(초)입니다. 이 예제에서는 60초와 5분을 곱셈하여 300초를 사용합니다. 평가 기간은 지표 값을 임계값과 비교해야 하는 연속 기간의 수입니다. 이 예제에서는 2를 사용합니다. 경보 작업은 경보가 트리거될 때 수행할 작업입니다. 이 예제에서는 Amazon SNS를 사용해 이메일을 보낼 수 있도록 경보를 구성합니다.