Grafana 관리형 알림 규칙 생성 - Amazon Managed Grafana

Grafana 관리형 알림 규칙 생성

이 설명서 주제는 Grafana 버전 9.x를 지원하는 Grafana 워크스페이스를 위해 설계되었습니다.

Grafana 버전 10.x를 지원하는 Grafana 워크스페이스의 경우 Grafana 버전 10에서 작업 섹션을 참조하세요.

Grafana 버전 8.x를 지원하는 Grafana 워크스페이스의 경우 Grafana 버전 8에서 작업 섹션을 참조하세요.

Grafana를 사용하면 하나 이상의 데이터 소스를 쿼리하고, 결과를 줄이거나 변환하며, 서로 비교하거나 임계치를 수정하는 알림 규칙을 생성할 수 있습니다. 이러한 작업이 실행되면 Grafana는 연락 지점에 알림을 보냅니다.

Grafana 관리형 규칙을 추가하는 방법
  1. Grafana 콘솔의 Grafana 메뉴에서 알림(종 모양) 아이콘을 선택하여 기존 알림을 나열하는 알림 페이지를 여세요.

  2. 새 알림 규칙을 선택하세요.

  3. 1단계에서 다음과 같이 규칙 이름, 유형 및 스토리지 위치를 추가하세요.

    • 규칙 이름에 설명이 포함된 이름을 추가하세요. 이 이름은 알림 규칙 목록에 표시됩니다. 또한 이 규칙에서 생성된 모든 알림 인스턴스에 대한 alertname 레이블이기도 합니다.

    • 규칙 유형 드롭다운에서 Grafana 관리형 알림을 선택하세요.

    • 폴더 드롭다운에서 규칙을 저장할 폴더를 선택하세요. 폴더를 선택하지 않으면 규칙은 General 폴더에 저장됩니다. 폴더를 생성하려면 드롭다운을 선택하고 새 폴더 이름을 입력하세요.

  4. 2단계에서 평가할 쿼리와 표현식을 추가하세요.

    • 기본 이름을 그대로 두거나 마우스를 위로 가져가 편집 아이콘을 선택하여 이름을 변경하세요.

    • 쿼리의 경우 드롭다운에서 데이터 소스를 선택하세요.

    • 하나 이상의 쿼리 또는 표현식을 추가하세요.

    • 각 표현식에 대해 클래식 조건을 선택하여 단일 알림 규칙을 생성하거나 수학, 축소, 리샘플링 옵션 중에서 선택하여 각 시리즈에 대해 별도의 알림을 생성하세요. 이러한 옵션에 대한 자세한 내용은 단일 및 다차원 규칙 섹션을 참조하세요.

    • 쿼리 실행을 선택하여 쿼리가 성공했는지 확인하세요.

  5. 3단계에서 조건을 추가하세요.

    • 조건 드롭다운에서 쿼리 또는 표현식을 선택하여 알림 규칙을 시작하세요.

    • 평가 간격에서 평가 빈도를 지정합니다. 10초의 배수여야 합니다. 예, 1m, 30s.

    • 평가 대상에서 알림이 시작되기 전에 조건이 true여야 하는 기간을 지정하세요.

      참고

      조건이 위반되면 알림이 Pending 상태가 됩니다. 지정된 기간에 조건이 위반된 상태로 유지되면 알림이 Firing 상태로 전환됩니다. 더 이상 충족되지 않으면 Normal 상태로 돌아갑니다.

    • 데이터 없음 및 오류 처리 구성에서 데이터가 없는 경우 알림 동작을 구성하세요. 데이터 없음 또는 오류 사례 처리의 지침을 사용하세요.

    • 미리 보기를 선택하여 현재 쿼리 실행 결과를 확인하세요. 미리 보기에서는 데이터 없음 및 오류 처리 조건이 제외됩니다.

  6. 4단계에서 규칙과 연결된 메타데이터를 추가하세요.

    • 설명과 요약을 추가하여 알림 메시지를 사용자 지정하세요. 레이블 및 주석의 지침을 사용하세요.

    • 런북 URL, 패널, 대시보드 및 알림 ID를 추가하세요.

    • 사용자 지정 레이블을 추가하세요.

  7. 저장을 선택하여 규칙을 저장하거나 저장 및 종료를 선택하여 규칙을 저장하고 알림 페이지로 돌아가세요.

규칙을 생성한 후 규칙에 대한 알림을 생성할 수 있습니다. 알림에 대한 자세한 내용은 알림 전달 관리 섹션을 참조하세요.

단일 및 다차원 규칙

Grafana 관리형 알림 규칙의 경우 클래식 조건의 규칙을 생성하거나 다차원 규칙을 생성할 수 있습니다.

단일 차원 규칙(클래식 조건)

클래식 조건 표현식을 사용하여 조건이 충족될 때 단일 알림을 시작하는 규칙을 생성합니다. 여러 시리즈를 반환하는 쿼리의 경우 Grafana에서는 각 시리즈의 알림 상태를 추적하지 않습니다. 따라서 Grafana는 여러 시리즈에 대한 알림 조건이 충족되더라도 단일 알림만 전송합니다.

표현식을 포맷하는 방법에 대한 자세한 내용은 Grafana 설명서Expressions를 참조하세요.

다차원 규칙

쿼리에서 반환된 각 시리즈에 대해 별도의 알림 인스턴스를 생성하려면 다차원 규칙을 생성합니다.

참고

다차원 규칙에 의해 생성된 각 알림 인스턴스는 총 알림 할당량에 포함됩니다. 알림 할당량에 도달하면 규칙이 평가되지 않습니다. 다차원 규칙의 할당량에 대한 자세한 내용은 할당량에 도달함 오류 섹션을 참조하세요.

단일 규칙에서 여러 인스턴스를 생성하려면 Math, Reduce 또는 Resample 표현식을 사용하여 다차원 규칙을 생성합니다. 예를 들어, 다음을 수행할 수 있습니다.

  • 각 쿼리에 Reduce 표현식을 추가하여 선택한 시간 범위의 값을 단일 값으로 집계합니다. (숫자 데이터를 사용하는 규칙에는 필요하지 않습니다.)

  • 규칙의 조건에 Math 표현식을 추가합니다. 쿼리 또는 축소 표현식에서 규칙이 알림을 시작하지 않아야 하는 경우 0 또는 알림을 시작해야 하는 경우 양수를 이미 반환하는 경우 필요하지 않습니다.

    다음은 일부 예입니다.

    • $B > 70: B 쿼리/표현식 값이 70을 초과하는 경우 알림을 시작해야 하는지 여부.

    • $B < $C * 100: B 값이 C 값에 100을 곱한 값보다 작은 경우 알림을 시작해야 하는 경우. 비교 중인 쿼리의 결과에 여러 시리즈가 있는 경우 레이블이 같거나 한 쿼리가 다른 쿼리의 하위 세트인 경우 서로 다른 쿼리의 시리즈가 일치합니다.

참고

Grafana에서는 템플릿 변수가 있는 알림 쿼리를 지원하지 않습니다. 자세한 내용은 커뮤니티 페이지(Template variables are not supported in alert queries while setting up Alert)에서 확인할 수 있습니다.

다차원 규칙에 대한 성능 고려 사항

각 알림 인스턴스는 알림 할당량에 포함됩니다. 알림 할당량 내에서 수용할 수 있는 것보다 많은 인스턴스를 생성하는 다차원 규칙은 평가되지 않으며 할당량 오류를 반환합니다. 자세한 내용은 할당량에 도달함 오류 단원을 참조하십시오.

다차원 알림은 Grafana에서 알림 규칙을 평가하기 위해 쿼리할 때 Grafana 워크스페이스의 성능뿐만 아니라 데이터 소스의 성능에도 큰 영향을 미칠 수 있습니다. 다음 고려 사항은 모니터링 시스템의 성능을 최적화하는 데 도움이 될 수 있습니다.

  • 규칙 평가 빈도 - 알림 규칙의 평가 간격 속성은 규칙 평가 빈도를 제어합니다. 허용되는 최조 평가 빈도를 사용하는 것이 좋습니다.

  • 결과 세트 카디널리티 - 규칙으로 생성한 알림 인스턴스 수가 성능에 영향을 미칩니다. 플릿의 모든 VM에서 모든 API 경로에 대한 API 응답 오류를 모니터링한다고 가정합니다 이 세트에는 경로 수에 VM 수를 곱한 카디널리티가 있습니다. 예를 들어, VM당 경로 기준 대신 VM당 총 오류 수를 모니터링하여 결과 세트의 카디널리티를 줄일 수 있습니다.

  • 쿼리의 복잡성 - 데이터 소스가 처리 및 응답하여 리소스를 빠르게 소비할 수 있는 쿼리. 이 고려 사항은 위에 나열된 다른 고려 사항보다 덜 중요하지만, 최대한 줄이면 개별 쿼리 성능을 살펴볼 때 차이가 나타날 수 있습니다. 또한 이러한 규칙의 평가가 데이터 소스에 미치는 성능 영향도 알고 있어야 합니다. 알림 쿼리는 데이터베이스 모니터링으로 처리되는 대부분의 쿼리이므로 Grafana 인스턴스에 영향을 미치는 동일한 부하 인자도 이에 영향을 미칩니다.

할당량에 도달함 오류

단일 워크스페이스에 있을 수 있는 알림 인스턴스 수에 대한 할당량이 있습니다. 해당 숫자에 도달하면 해당 워크스페이스에서 더 이상 새 알림 규칙을 생성할 수 없습니다. 다차원 알림의 경우 알림 인스턴스 수는 시간이 지남에 따라 달라질 수 있습니다.

다음은 알림 인스턴스로 작업할 때 명심해야 할 중요한 사항입니다.

  • 단일 차원 규칙만 생성하는 경우 각 규칙은 단일 알림 인스턴스입니다. 단일 워크스페이스에서 알림 인스턴스 할당량과 동일한 수의 규칙을 생성할 수 있으며 그 이상은 생성할 수 없습니다.

  • 다차원 규칙은 여러 개의 알림 인스턴스를 생성하지만, 해당 인스턴스가 평가될 때까지 수를 알 수 없습니다. 예를 들어 Amazon EC2 인스턴스의 CPU 사용량을 추적하는 알림 규칙을 생성하는 경우 생성할 때 EC2 인스턴스가 50개(따라서 알림 인스턴스 50개)일 수 있지만 일주일 후에 EC2 인스턴스를 10개 더 추가하는 경우 다음 평가에서 알림 인스턴스는 60개입니다.

    알림 인스턴스 수는 다차원 경고를 생성할 때 평가되며, 알림 인스턴스 할당량을 즉시 초과하는 알림은 생성할 수 없습니다. 알림 인스턴스 수는 변경될 수 있으므로 규칙이 평가될 때마다 할당량이 확인됩니다.

  • 규칙 평가 시 규칙으로 인해 알림 인스턴스의 할당량을 초과하면 총 알림 인스턴스 수를 서비스 할당량 미만으로 가져오는 알림 규칙을 업데이트할 때까지 해당 규칙이 평가되지 않습니다. 이 경우 할당량에 도달했음을 알리는 알림 전달을 수신합니다(알림은 평가 중인 규칙에 대한 알림 정책을 사용함). 알림에는 값이 QuotaReachedErrorError 주석이 포함됩니다.

  • QuotaReachedError로 평가를 중지하는 규칙. 평가는 업데이트가 수행되고 업데이트 후 평가 자체로 인해 QuotaReachedError가 발생하지 않는 경우에만 재개됩니다. 평가되지 않는 규칙은 Grafana 콘솔에서 할당량에 도달함 오류를 표시합니다.

  • 알림 규칙을 제거하거나 다차원 알림을 편집하여 알림 인스턴스 수를 줄일 수 있습니다(예: VM의 API당 오류에 대한 하나의 알림이 아니라 VM당 오류에 대한 하나의 알림 생성).

  • 평가를 재개하려면 알림을 업데이트하고 저장합니다. 이를 업데이트하여 알림 인스턴스 수를 줄이거나 다른 변경 사항을 적용하여 알림 인스턴스 수를 줄인 경우 변경 없이 저장할 수 있습니다. 재개할 수 있는 경우 재개합니다. 다른 QuotaReachedError가 발생하면 저장할 수 없습니다.

  • 알림 할당량을 초과하지 않고 알림이 저장되고 평가를 재개하면 할당량에 도달함 오류가 Grafana 콘솔에 일정 시간 동안(평가 간격까지) 계속 표시될 수 있지만, 규칙 임계치가 충족되면 알림 규칙 평가가 시작되고 알림이 전송됩니다.

  • 알림 할당량 및 기타 할당량에 대한 자세한 내용은 Amazon Managed Grafana 서비스 할당량 섹션을 참조하세요.

데이터 없음 또는 오류 사례 처리

데이터가 없거나 오류가 있을 때 알림 동작을 처리하는 방법에 대한 옵션을 선택합니다.

데이터 없음 처리를 위한 옵션은 다음 표에 나열되어 있습니다.

데이터 없음 옵션 동작

데이터 없음

알림 규칙의 이름과 UID, 레이블로 데이터를 반환하지 않은 데이터 소스의 UID를 사용하여 DatasourceNoData 알림을 생성합니다.

알림

알림 규칙 상태를 Alerting 상태로 설정합니다.

정상

알림 규칙 상태를 Normal 상태로 설정합니다.

오류 사례 처리 옵션은 다음 표에 나와 있습니다.

오류 또는 제한 시간 옵션 동작

알림

알림 규칙 상태를 Alerting 상태로 설정

정상

알림 규칙 상태를 Normal 상태로 설정

Error

알림 규칙의 이름과 UID, 레이블로 데이터를 반환하지 않은 데이터 소스의 UID를 사용하여 DatasourceError 알림을 생성합니다.