연결된 데이터 소스를 기반으로 경보 생성 - Amazon CloudWatch

연결된 데이터 소스를 기반으로 경보 생성

CloudWatch에 없는 데이터 소스의 지표를 감시하는 경보를 생성할 수 있습니다. 이러한 다른 데이터 소스에 대한 연결을 생성하는 방법에 대한 자세한 내용은 다른 데이터 소스의 쿼리 지표 섹션을 참조하세요.

연결한 데이터 소스의 지표에 대한 경보 생성
  1. https://console.aws.amazon.com/cloudwatch/에서 CloudWatch 콘솔을 엽니다.

  2. 탐색 창에서 지표, 모든 지표를 선택합니다.

  3. 다중 소스 쿼리 탭을 선택합니다.

  4. 데이터 소스에서 사용할 데이터 소스를 선택합니다.

  5. 쿼리 작성기가 쿼리가 경보에 사용할 지표를 검색하는 데 필요한 정보를 입력하라는 메시지를 표시합니다. 워크플로는 각 데이터 소스마다 다르며 데이터 소스에 맞게 조정됩니다. 예를 들어, Amazon Managed Service for Prometheus 및 Prometheus 데이터 소스의 경우 쿼리 도우미가 포함된 PromQL 쿼리 편집기 상자가 나타납니다.

  6. 쿼리 구성을 마치면 쿼리 그래프로 표시를 선택합니다.

  7. 샘플 그래프가 예상과 같으면 경보 생성을 선택합니다.

  8. 지표 및 조건 지정 페이지가 나타납니다. 사용 중인 쿼리가 둘 이상의 시계열을 생성하는 경우 페이지 상단에 경고 배너가 표시됩니다. 그럴 경우 집계 함수에서 시계열을 집계하는 데 사용할 함수를 선택합니다.

  9. (선택 사항) 경보에 대한 레이블을 추가합니다.

  10. your-metric-name이 다음과 같은 경우에 항상…에서 보다 큼, 보다 크거나 같음, 보다 작거나 같음 또는 보다 작음을 선택합니다. :에 임곗값에 대한 숫자를 지정합니다.

  11. 추가 구성을 선택합니다. 경보에 대한 데이터 포인트에서 경보를 트리거하기 위해 평가 기간(데이터 포인트)이 ALARM 상태로 유지해야 하는 기간을 지정합니다. 두 값이 일치하는 경우 다수의 연속 기간이 위반되면 ALARM 상태가 되는 경보가 생성됩니다.

    N개 중 M번째 경보를 생성하려면 두 번째 값의 숫자보다 작은 값을 첫 번째 값에 지정합니다. 자세한 내용은 경보 평가 단원을 참조하십시오.

  12. 누락 데이터 처리(Missing data treatment)에서 일부 데이터 포인트가 누락된 경우 경보가 어떻게 동작할지 선택합니다. 자세한 내용은 CloudWatch 경보가 누락 데이터를 처리하는 방법 구성 단원을 참조하십시오.

  13. Next(다음)를 선택합니다.

  14. 알림에서 경보가 ALARM, OK 또는 INSUFFICIENT_DATA 상태로 전환될 때 알림을 보낼 Amazon SNS 주제를 지정합니다.

    1. (선택 사항) 동일한 경보 상태 또는 다른 경보 상태에 대해 여러 개의 알림을 보내려면 Add notification(알림 추가)을 선택합니다.

      참고

      경보 상태가 되는 경우와 함께 데이터 부족 상태가 되는 경우에도 조치를 취하도록 경보를 설정하는 것이 좋습니다. 데이터 소스에 연결되는 Lambda 함수와 관련된 많은 문제로 인해 경보가 데이터 부족 상태로 전환될 수 있기 때문입니다.

    2. (선택 사항) Amazon SNS 알림을 보내지 않으려면 제거를 선택합니다.

  15. 경보가 Auto Scaling, EC2, Lambda 또는 Systems Manager 작업을 수행하도록 하려면 해당 버튼을 선택하고 경보 상태와 수행할 작업을 선택합니다. Lambda 함수를 경보 작업으로 선택하는 경우 함수 이름 또는 ARN을 지정하고 필요에 따라 함수의 특정 버전을 선택할 수 있습니다.

    경보는 ALARM 상태가 될 때만 Systems Manager 작업을 수행할 수 있습니다. Systems Manager 작업에 대한 자세한 내용은 경보에서 OpsItem을 생성하도록 CloudWatch 구성인시던트 생성 단원을 참조하세요.

    참고

    SSM Incident Manager 작업을 수행하는 경보를 생성하려면 특정 권한이 있어야 합니다. 자세한 내용은 AWS Systems Manager Incident Manager의 자격 증명 기반 정책 예 단원을 참조하세요.

  16. 다음을 선택합니다.

  17. 이름 및 설명에서 경보의 이름과 설명을 입력하고 다음을 선택합니다. 이름에는 UTF-8 문자만 포함해야 하며 ASCII 제어 문자는 포함할 수 없습니다. 설명에 마크다운 서식을 포함할 수 있으며, 이는 CloudWatch 콘솔에서 경보 세부 정보 탭에만 표시됩니다. 마크다운은 런북이나 기타 내부 리소스에 대한 링크를 추가하는 데 유용할 수 있습니다.

    작은 정보

    경보 이름에는 UTF-8 문자만 포함되어야 합니다. ASCII 제어 문자를 포함할 수 없습니다.

  18. 미리 보기 및 생성에서 정보 및 조건이 원하는 내용인지 확인한 다음 경보 생성을 선택합니다.

연결된 데이터 소스의 경보에 대한 세부 정보

  • CloudWatch는 경보를 평가할 때 경보 기간이 1분 이상이더라도 1분마다 평가를 수행합니다. 경보가 작동하려면 Lambda 함수가 기간 길이의 배수뿐만 아니라 임의의 분에 시작하는 타임스탬프 목록을 반환할 수 있어야 합니다. 이러한 타임스탬프는 한 기간 길이 간격으로 떨어져 있어야 합니다.

    따라서 Lambda에서 쿼리한 데이터 소스가 기간 길이의 배수인 타임스탬프만 반환할 수 있는 경우 함수는 GetMetricData 요청에서 예상하는 타임스탬프와 일치하도록 가져온 데이터를 '다시 샘플링'해야 합니다.

    예를 들어, 기간이 5분인 경보는 매번 1분씩 이동하는 5분 기간을 사용하여 1분마다 평가됩니다. 이 경우

    • 12:15:00의 경보 평가에 대해 CloudWatch는 타임스탬프가 12:00:00, 12:05:0012:10:00인 데이터 포인트를 예상합니다.

    • 그런 다음 12:16:00의 경보 평가에 대해 CloudWatch는 타임스탬프가 12:01:00, 12:06:0012:11:00인 데이터 포인트를 예상합니다.

  • CloudWatch가 경보를 평가할 때 Lambda 함수에서 반환한 데이터 포인트 중 예상 타임스탬프와 일치하지 않는 모든 데이터 포인트는 삭제되고 나머지 예상 데이터 포인트를 사용하여 경보가 평가됩니다. 예를 들어, 경보가 12:15:00에 평가되면 CloudWatch는 타임스탬프가 12:00:00, 12:05:0012:10:00인 데이터를 예상합니다. 타임스탬프가 12:00:00, 12:05:00, 12:06:0012:10:00인 데이터를 수신하면 12:06:00의 데이터가 삭제되고 CloudWatch는 다른 타임스탬프를 사용하여 경보를 평가합니다.

    그런 다음 12:16:00의 다음 평가에 대해 CloudWatch는 타임스탬프가 12:01:00, 12:06:0012:11:00인 데이터를 예상합니다. 타임스탬프가 12:00:00, 12:05:0012:10:00인 데이터만 있는 경우 12:16:00에 이러한 데이터 포인트가 모두 무시되고 누락된 데이터를 처리하기 위해 경보를 지정한 방법에 따라 알람이 해당 상태로 전환됩니다. 자세한 내용은 경보 평가 단원을 참조하십시오.

  • INSUFFICIENT_DATA 상태로 전환될 때 조치를 취하도록 이러한 경보를 생성하는 것이 좋습니다. 여러 Lambda 함수 실패 사용 사례에서는 누락된 데이터를 처리하기 위해 경보를 설정한 방식에 관계없이 경보가 INSUFFICIENT_DATA로 전환되기 때문입니다.

  • Lambda 함수가 오류를 반환하거나 부분 데이터를 반환하는 경우

    • Lambda 함수를 호출하는 데 권한 문제가 있는 경우, 생성 시 누락된 데이터를 처리하도록 경보를 지정한 방법에 따라 경보에서 누락된 데이터 전환이 발생하기 시작합니다.

    • Lambda 함수가 'StatusCode' = 'PartialData'를 반환하면 경보 평가가 실패하고 세 번의 시도 후에 경보가 INSUFFICIENT_DATA로 전환됩니다.

    • Lambda 함수에서 발생하는 다른 오류로 인해 경보가 INSUFFICIENT_DATA로 전환됩니다.

  • Lambda 함수에서 요청한 지표에 약간의 지연이 발생하여 마지막 데이터 포인트가 항상 누락되는 경우 해결 방법을 사용해야 합니다. N개 중 M개의 경보를 생성하거나 경보 평가 기간을 늘릴 수 있습니다. M개 중 N개의 경보에 대한 자세한 내용은 경보 평가 섹션을 참조하세요.