Grafana 알림 규칙 생성 및 관리 - Amazon Managed Grafana

Grafana 알림 규칙 생성 및 관리

이 설명서 주제는 Grafana 버전 8.x를 지원하는 Grafana 워크스페이스를 위해 설계되었습니다.

Grafana 버전 10.x를 지원하는 Grafana 워크스페이스는 Grafana 버전 10에서 작업 섹션을 참조하세요.

Grafana 버전 9.x를 지원하는 Grafana 워크스페이스는 Grafana 버전 9에서 작업 섹션을 참조하세요.

알림 규칙은 알림 시작 여부를 결정하는 평가 기준 세트입니다. 규칙은 하나 이상의 쿼리와 표현식, 조건, 평가 빈도 및 조건이 충족되는 기간(선택 사항)으로 구성됩니다.

쿼리 및 표현식에서는 평가할 데이터세트를 선택하는 반면, 조건은 알림을 생성하기 위해 알림에서 충족하거나 초과해야 하는 임계치를 설정합니다. 간격은 알림 규칙이 평가되는 빈도를 지정합니다. 기간을 구성하면 조건을 충족해야 하는 기간을 나타냅니다. 또한 규칙은 데이터가 없는 경우 알림 동작을 정의할 수 있습니다.

다음 섹션에서는 다양한 종류의 Grafana 알림 규칙 생성 및 관리를 설명합니다.

Cortex 또는 Loki 관리형 알림 규칙 생성

Grafana를 사용하면 외부 Cortex 또는 Loki 인스턴스에 대한 알림 규칙을 생성할 수 있습니다.

참고

Cortex는 Amazon Managed Service for Prometheus 및 Prometheus 데이터 소스에서 사용하는 시계열 데이터베이스입니다.

사전 조건 

  • Prometheus 데이터 소스에 대한 쓰기 권한이 있는지 확인합니다. 그렇지 않으면 Cortex 관리형 알림 규칙을 생성하거나 업데이트할 수 없습니다.

  • Cortex 및 Loki 데이터 소스의 경우 해당 서비스를 구성하여 눈금자 API를 활성화합니다.

    • Loki - Loki 데이터 소스의 기본값인 local 규칙 스토리지 유형은 규칙 보기만 지원합니다. 규칙을 편집하려면 다른 스토리지 유형 중 하나를 구성합니다.

    • Cortex - /prometheus가 아닌 레거시 /api/prom 접두사를 사용합니다. Prometheus 데이터 소스는 Cortex 및 Prometheus를 모두 지원하며 Grafana는 쿼리 API 및 눈금자 API가 모두 동일한 URL에 있을 것으로 예상합니다. 눈금자 API에 별도의 URL을 제공할 수 없습니다.

참고

특정 Loki 또는 Prometheus 데이터 소스에 대한 알림 규칙을 관리하지 않으려면 해당 설정으로 이동하여 알림 UI를 통해 알림 관리 확인란의 선택을 취소합니다.

Cortex 또는 Loki 관리형 알림 규칙을 추가하는 방법
  1. Grafana 콘솔의 Grafana 메뉴에서 알림(종 모양) 아이콘을 선택하여 기존 알림이 나열된 알림 페이지를 엽니다.

  2. 새 알림 규칙을 선택하세요.

  3. 1단계에서 다음과 같이 규칙 이름, 유형 및 스토리지 위치를 추가하세요.

    • 규칙 이름에 설명이 포함된 이름을 추가하세요. 이 이름은 알림 규칙 목록에 표시됩니다. 또한 이 규칙에서 생성된 모든 알림 인스턴스에 대한 alertname 레이블이기도 합니다.

    • 규칙 유형 드롭다운에서 Cortex/Loki 관리형 알림을 선택하세요.

    • 데이터 소스 선택 드롭다운에서 Prometheus 또는 Loki 데이터 소스를 선택하세요.

    • 네임스페이스 드롭다운에서 기존 규칙 네임스페이스를 선택하세요. 그렇지 않으면 새로 추가를 선택하고 이름을 입력하여 이름을 생성하세요. 네임스페이스는 하나 이상의 규칙 그룹을 포함할 수 있으며 조직의 목적만 보유할 수 있습니다. 자세한 내용은 Cortex 또는 Loki 규칙 그룹 및 네임스페이스 단원을 참조하십시오.

    • 그룹 드롭다운에서 선택한 네임스페이스 내에서 기존 그룹을 선택하세요. 그렇지 않으면 새로 추가를 선택하고 이름을 입력하여 이름을 생성하세요. 새로 생성된 규칙은 그룹 끝에 추가됩니다. 그룹 내 규칙은 동일한 평가 시간으로 일정한 간격에 따라 순차적으로 실행됩니다.

  4. 2단계에서 평가할 쿼리를 추가하세요.

    값은 PromQL 또는 LogQL 표현식일 수 있습니다. 평가 결과에 값이 0보다 큰 시리즈가 하나 이상 있는 경우 규칙은 알림을 시작합니다. 각 시리즈에 대한 알림이 생성됩니다.

  5. 3단계에서 조건을 추가하세요.

    조건의 기간 텍스트 상자에 알림이 시작되기 전 조건이 true여야 하는 기간을 지정하세요. 5m을 지정하는 경우 알림이 시작되기 전에 5분 동안 조건이 true여야 합니다.

    참고

    조건이 충족되면 알림이 Pending 상태가 됩니다. 지정된 기간에 조건이 활성 상태로 유지되면 알림이 Firing 상태로 전환됩니다. 더 이상 충족되지 않으면 Normal 상태로 돌아갑니다.

  6. 4단계에서 규칙과 연결된 메타데이터를 추가하세요.

    • 설명과 요약을 추가하여 알림 메시지를 사용자 지정하세요. 알림 규칙에 대한 주석 및 레이블의 지침을 사용하세요.

    • 런북 URL, 패널, 대시보드 및 알림 ID를 추가하세요.

    • 사용자 지정 레이블을 추가하세요.

  7. 알림 미리 보기를 선택하여 규칙을 평가하고 어떤 알림을 생성할지 확인하세요. 각 알림의 상태 및 값과 함께 알림 목록을 표시합니다.

  8. 저장을 선택하여 규칙을 저장하거나 저장 및 종료를 선택하여 규칙을 저장하고 알림 페이지로 돌아가세요.

Cortex 또는 Loki 관리형 기록 규칙 생성

외부 Cortex 또는 Loki 인스턴스에 대한 기록 규칙을 생성 및 관리할 수 있습니다. 기록 규칙을 사용하면 자주 필요하거나 계산 비용이 많이 드는 표현식을 미리 계산하고, 해당 결과를 새로운 시계열 세트로 저장합니다. 이 새 시계열을 쿼리하는 것이 더 빠릅니다. 특히 대시보드를 새로 고칠 때마다 동일한 표현식을 쿼리하기 때문에 대시보드의 경우 더 빠릅니다.

사전 조건 

Cortex 및 Loki 데이터 소스의 경우 해당 서비스를 구성하여 눈금자 API를 활성화합니다.

  • Loki - Loki 데이터 소스의 기본값인 local 규칙 스토리지 유형은 규칙 보기만 지원합니다. 규칙을 편집하려면 다른 스토리지 유형 중 하나를 구성합니다.

  • Cortex - Cortex를 가리키도록 Grafana Prometheus 데이터 소스를 구성할 때 /prometheus가 아닌 레거시 /api/prom 접두사를 사용합니다. Prometheus 데이터 소스는 Cortex 및 Prometheus를 모두 지원하며 Grafana는 쿼리 API 및 눈금자 API가 모두 동일한 URL에 있을 것으로 예상합니다. 눈금자 API에 별도의 URL을 제공할 수 없습니다.

참고

특정 Loki 또는 Prometheus 데이터 소스에 대한 알림 규칙을 관리하지 않으려면 해당 설정으로 이동하여 알림 UI를 통해 알림 관리 확인란의 선택을 취소합니다.

Cortex 또는 Loki 관리형 기록 규칙을 추가하는 방법
  1. Grafana 콘솔의 Grafana 메뉴에서 알림(종 모양) 아이콘을 선택하여 기존 알림이 나열된 알림 페이지를 엽니다.

  2. 새 알림 규칙을 선택하세요.

  3. 1단계에서 다음과 같이 규칙 이름, 유형 및 스토리지 위치를 추가하세요.

    • 규칙 이름에 설명이 포함된 이름을 추가하세요. 이 이름은 알림 규칙 목록에 표시됩니다. 또한 이 규칙에서 생성된 모든 알림 인스턴스에 대한 alertname 레이블이기도 합니다.

    • 규칙 유형 드롭다운에서 Cortex/Loki 관리형 알림을 선택하세요.

    • 데이터 소스 선택 드롭다운에서 Prometheus 또는 Loki 데이터 소스를 선택하세요.

    • 네임스페이스 드롭다운에서 기존 규칙 네임스페이스를 선택하세요. 그렇지 않으면 새로 추가를 선택하고 이름을 입력하여 이름을 생성하세요. 네임스페이스는 하나 이상의 규칙 그룹을 포함할 수 있으며 조직의 목적만 보유할 수 있습니다. 자세한 내용은 Cortex 또는 Loki 규칙 그룹 및 네임스페이스 단원을 참조하십시오.

    • 그룹 드롭다운에서 선택한 네임스페이스 내에서 기존 그룹을 선택하세요. 그렇지 않으면 새로 추가를 선택하고 이름을 입력하여 이름을 생성하세요. 새로 생성된 규칙은 그룹 끝에 추가됩니다. 그룹 내 규칙은 동일한 평가 시간으로 일정한 간격에 따라 순차적으로 실행됩니다.

  4. 2단계에서 평가할 쿼리를 추가하세요.

    값은 PromQL 또는 LogQL 표현식일 수 있습니다. 평가 결과에 값이 0보다 큰 시리즈가 하나 이상 있는 경우 규칙은 알림을 시작합니다. 각 시리즈에 대한 알림이 생성됩니다.

  5. 3단계에서 규칙과 연결된 메타데이터를 추가하세요.

    • 설명과 요약을 추가하여 알림 메시지를 사용자 지정하세요. 알림 규칙에 대한 주석 및 레이블의 지침을 사용하세요.

    • 런북 URL, 패널, 대시보드 및 알림 ID를 추가하세요.

    • 사용자 지정 레이블을 추가하세요.

  6. 저장을 선택하여 규칙을 저장하거나 저장 및 종료를 선택하여 규칙을 저장하고 알림 페이지로 돌아가세요.

Grafana 관리형 알림 규칙 생성

Grafana를 사용하면 하나 이상의 데이터 소스를 쿼리하고, 결과를 줄이거나 변환하며, 서로 비교하거나 임계치를 수정하는 알림 규칙을 생성할 수 있습니다. 이러한 작업이 처리되면 Grafana는 연락 지점에 알림을 보냅니다.

참고

Grafana 알림을 사용하는 동안 Grafana 관리형 알림 규칙을 생성하면 규칙이 일치할 때 여러 알림이 전송됩니다. 일부 연락 지점 제공업체에는 알림을 중복 제거하는 구성 가능한 옵션이 있을 수 있습니다.

Grafana 관리형 규칙을 추가하는 방법
  1. Grafana 콘솔의 Grafana 메뉴에서 알림(종 모양) 아이콘을 선택하여 기존 알림이 나열된 알림 페이지를 엽니다.

  2. 새 알림 규칙을 선택하세요.

  3. 1단계에서 다음과 같이 규칙 이름, 유형 및 스토리지 위치를 추가하세요.

    • 규칙 이름에 설명이 포함된 이름을 추가하세요. 이 이름은 알림 규칙 목록에 표시됩니다. 또한 이 규칙에서 생성된 모든 알림 인스턴스에 대한 alertname 레이블이기도 합니다.

    • 규칙 유형 드롭다운에서 Grafana 관리형 알림을 선택하세요.

    • 폴더 드롭다운에서 규칙을 저장할 폴더를 선택하세요. 폴더를 선택하지 않으면 규칙은 General 폴더에 저장됩니다. 폴더를 생성하려면 드롭다운을 선택하고 새 폴더 이름을 입력하세요.

  4. 2단계에서 평가할 쿼리와 표현식을 추가하세요.

    • 기본 이름을 그대로 두거나 마우스를 위로 가져가 편집 아이콘을 선택하여 이름을 변경하세요.

    • 쿼리의 경우 드롭다운에서 데이터 소스를 선택하세요.

    • 하나 이상의 쿼리 또는 표현식을 추가합니다(표현식에 대한 자세한 내용은 Grafana 설명서의 Expressions 참조).

    • 각 표현식에 대해 클래식 조건을 선택하여 단일 알림 규칙을 생성하거나 수학, 축소, 리샘플링 옵션 중에서 선택하여 각 시리즈에 대해 별도의 알림을 생성하세요. 이러한 옵션에 대한 자세한 내용은 단일 및 다차원 규칙 섹션을 참조하세요.

    • 쿼리 실행을 선택하여 쿼리가 성공했는지 확인하세요.

  5. 3단계에서 조건을 추가하세요.

    • 조건 드롭다운에서 쿼리 또는 표현식을 선택하여 알림 규칙을 시작하세요.

    • 평가 간격에서 평가 빈도를 지정합니다. 10초의 배수여야 합니다. 예, 1m, 30s.

    • 평가 대상에서 알림이 시작되기 전에 조건이 true여야 하는 기간을 지정하세요.

      참고

      조건이 위반되면 알림이 Pending 상태가 됩니다. 지정된 기간에 조건이 위반된 상태로 유지되면 알림이 Firing 상태로 전환됩니다. 더 이상 충족되지 않으면 Normal 상태로 돌아갑니다.

    • 데이터 없음 및 오류 처리 구성에서 데이터가 없는 경우 알림 동작을 구성하세요. 데이터 없음 또는 오류 사례 처리의 지침을 사용하세요.

    • 미리 보기를 선택하여 현재 쿼리 실행 결과를 확인하세요. 미리 보기에서는 데이터 없음 및 오류 처리 조건이 제외됩니다.

  6. 4단계에서 규칙과 연결된 메타데이터를 추가하세요.

    • 설명과 요약을 추가하여 알림 메시지를 사용자 지정하세요. 알림 규칙에 대한 주석 및 레이블의 지침을 사용하세요.

    • 런북 URL, 패널, 대시보드 및 알림 ID를 추가하세요.

    • 사용자 지정 레이블을 추가하세요.

  7. 저장을 선택하여 규칙을 저장하거나 저장 및 종료를 선택하여 규칙을 저장하고 알림 페이지로 돌아가세요.

단일 및 다차원 규칙

Grafana 관리형 알림 규칙의 경우 클래식 조건의 규칙을 생성하거나 다차원 규칙을 생성할 수 있습니다.

단일 차원 규칙(클래식 조건)

클래식 조건 표현식을 사용하여 조건이 충족될 때 단일 알림을 시작하는 규칙을 생성합니다. 여러 시리즈를 반환하는 쿼리의 경우 Grafana에서는 각 시리즈의 알림 상태를 추적하지 않습니다. 따라서 Grafana는 여러 시리즈에 대한 알림 조건이 충족되더라도 단일 알림만 전송합니다.

표현식을 포맷하는 방법에 대한 자세한 내용은 Grafana 설명서Expressions를 참조하세요.

다차원 규칙

쿼리에서 반환된 각 시리즈에 대해 별도의 알림 인스턴스를 생성하려면 다차원 규칙을 생성합니다.

참고

다차원 규칙에 의해 생성된 각 알림 인스턴스는 총 알림 할당량에 포함됩니다. 알림 할당량에 도달하면 규칙이 평가되지 않습니다. 다차원 규칙의 할당량에 대한 자세한 내용은 할당량에 도달함 오류 섹션을 참조하세요.

단일 규칙에서 여러 인스턴스를 생성하려면 Math, Reduce 또는 Resample 표현식을 사용하여 다차원 규칙을 생성합니다. 예를 들어, 다음을 수행할 수 있습니다.

  • 각 쿼리에 Reduce 표현식을 추가하여 선택한 시간 범위의 값을 단일 값으로 집계합니다. (숫자 데이터를 사용하는 규칙에는 필요하지 않습니다.)

  • 규칙의 조건에 Math 표현식을 추가합니다. 쿼리 또는 축소 표현식에서 규칙이 알림을 시작하지 않아야 하는 경우 0 또는 알림을 시작해야 하는 경우 양수를 이미 반환하는 경우 필요하지 않습니다.

    다음은 몇 가지 예제입니다.

    • $B > 70: B 쿼리/표현식 값이 70을 초과하는 경우 알림을 시작해야 하는지 여부.

    • $B < $C * 100: B 값이 C 값에 100을 곱한 값보다 작은 경우 알림을 시작해야 하는 경우. 비교 중인 쿼리의 결과에 여러 시리즈가 있는 경우 레이블이 같거나 한 쿼리가 다른 쿼리의 하위 세트인 경우 서로 다른 쿼리의 시리즈가 일치합니다.

참고

Grafana에서는 템플릿 변수가 있는 알림 쿼리를 지원하지 않습니다. 자세한 내용은 커뮤니티 페이지(Template variables are not supported in alert queries while setting up Alert)에서 확인할 수 있습니다.

다차원 규칙에 대한 성능 고려 사항

각 알림 인스턴스는 알림 할당량에 포함됩니다. 알림 할당량 내에서 수용할 수 있는 것보다 많은 인스턴스를 생성하는 다차원 규칙은 평가되지 않으며 할당량 오류를 반환합니다. 자세한 내용은 할당량에 도달함 오류 단원을 참조하십시오.

다차원 알림은 Grafana에서 알림 규칙을 평가하기 위해 쿼리할 때 Grafana 워크스페이스의 성능뿐만 아니라 데이터 소스의 성능에도 큰 영향을 미칠 수 있습니다. 다음 고려 사항은 모니터링 시스템의 성능을 최적화하는 데 도움이 될 수 있습니다.

  • 규칙 평가 빈도 - 알림 규칙의 평가 간격 속성은 규칙 평가 빈도를 제어합니다. 허용되는 가장 낮은 평가 빈도를 사용하는 것이 좋습니다.

  • 결과 세트 카디널리티 - 규칙과 함께 생성한 알림 인스턴스 수는 성능에 영향을 미칩니다. 플릿의 모든 VM에서 모든 API 경로에 대한 API 응답 오류를 모니터링한다고 가정합니다. 이 세트에는 경로 수에 VM 수를 곱한 카디널리티가 있습니다. 예를 들어, VM 기준 경로가 아닌 VM 기준 총 오류 수를 모니터링하여 결과 세트의 카디널리티를 줄일 수 있습니다.

  • 쿼리 복잡성 - 더 적은 리소스를 더 빠르게 소비하도록 데이터 소스에서 처리하고 응답하는 쿼리 수. 이 고려 사항은 위에 나열된 다른 고려 사항보다 덜 중요하지만, 가능한 한 이 항목을 줄이면 개별 쿼리 성능에서 큰 차이를 보일 수 있습니다. 또한 이러한 규칙 평가가 데이터 소스에 미치는 성능 영향도 알고 있어야 합니다. 알림 쿼리는 데이터베이스 모니터링으로 처리되는 대부분의 쿼리이므로 Grafana 인스턴스에 영향을 미치는 동일한 로드 요소가 여기에도 영향을 줍니다.

할당량에 도달함 오류

단일 워크스페이스 내 존재할 수 있는 알림 인스턴스 수에 할당량이 있습니다. 해당 수에 도달하면 해당 워크스페이스에서 더 이상 새 알림 규칙을 생성할 수 없습니다. 다차원 알림의 경우 알림 인스턴스 수는 시간이 지남에 따라 달라질 수 있습니다.

다음은 알림 인스턴스에 대해 작업할 때 기억해야 할 중요한 사항입니다.

  • 단일 차원 규칙만 생성하는 경우 각 규칙은 단일 알림 인스턴스입니다. 단일 워크스페이스에서 알림 인스턴스 할당량과 동일한 수의 규칙을 생성할 수 있으며 더 이상은 생성할 수 없습니다.

  • 다차원 규칙은 여러 개의 알림 인스턴스를 생성하지만, 해당 인스턴스가 평가될 때까지 수를 알 수 없습니다. 예를 들어 Amazon EC2 인스턴스의 CPU 사용량을 추적하는 알림 규칙을 생성하는 경우 생성할 때 EC2 인스턴스가 50개일 수 있지만(따라서 알림 인스턴스 50개) 일주일 후에 EC2 인스턴스를 10개 더 추가하는 경우 다음 평가에서 알림 인스턴스 수는 60개입니다.

    알림 인스턴스 수는 다차원 알림을 생성할 때 평가되며, 작시 알림 인스턴스 할당량을 초과하는 인스턴스는 생성할 수 없습니다. 알림 인스턴스 수는 변경될 수 있으므로 규칙을 평가할 때마다 할당량을 확인합니다.

  • 규칙 평가 시 규칙으로 인해 알림 인스턴스의 할당량을 초과하면 총 알림 인스턴스 수가 서비스 할당량 미만이 되도록 알림 규칙에 대한 업데이트가 수행될 때까지 해당 규칙이 평가되지 않습니다. 이 경우 할당량에 도달했음을 알리는 알림 전달을 수신합니다(이때 알림은 평가 중인 규칙에 대한 알림 정책을 사용함). 알림에는 값이 QuotaReachedErrorError 주석이 포함됩니다.

  • QuotaReachedError에서 평가를 중지시키는 규칙. 평가는 업데이트가 수행되고 업데이트 후 평가 자체로 인해 QuotaReachedError가 발생하지 않는 경우에만 재개됩니다. 평가되지 않는 규칙은 Grafana 콘솔에서 할당량에 도달함 오류를 표시합니다.

  • 알림 규칙을 제거하거나 다차원 알림을 편집하여 알림 인스턴스 수를 줄일 수 있습니다(예: VM에서 API당 오류 발생 시 하나의 알림이 아니라 VM 기준 오류 발생 시 하나의 알림).

  • 평가를 재개하려면 알림을 업데이트하고 저장합니다. 이를 업데이트하여 알림 인스턴스 수를 줄일 수 있습니다. 또는 다른 변경 사항을 적용하여 알림 인스턴스 수를 줄인 경우 변경 없이 저장할 수 있습니다. 재개할 수 있는 경우 재개합니다. 다른 QuotaReachedError가 발생하면 저장할 수 없습니다.

  • 알림 할당량을 초과하지 않고 알림이 저장되고 평가를 재개하면 할당량에 도달함 오류가 Grafana 콘솔에 일정 시간 동안(평가 간격까지) 계속 표시될 수 있지만, 규칙 임계치가 충족되면 알림 규칙 평가가 시작되고 알림이 전송됩니다.

  • 알림 할당량 및 기타 할당량에 대한 자세한 내용은 Amazon Managed Grafana 서비스 할당량 섹션을 참조하세요.

데이터 없음 또는 오류 사례 처리

데이터가 없거나 오류가 발생한 경우 알림 동작을 처리하는 방법에 대한 옵션을 선택합니다.

데이터 없음 처리를 위한 옵션은 다음 표에 나열되어 있습니다.

데이터 없음 옵션 동작

데이터 없음

알림 규칙의 이름과 UID, 레이블로 데이터를 반환하지 않은 데이터 소스의 UID를 사용하여 DatasourceNoData 알림을 생성합니다.

알림

알림 규칙 상태를 Alerting 상태로 설정합니다.

정상

알림 규칙 상태를 Normal 상태로 설정합니다.

오류 사례 처리 옵션은 다음 표에 나열되어 있습니다.

오류 또는 제한 시간 옵션 동작

알림

알림 규칙 상태를 Alerting 상태로 설정

정상

알림 규칙 상태를 Normal 상태로 설정

Error

알림 규칙의 이름과 UID, 레이블로 데이터를 반환하지 않은 데이터 소스의 UID를 사용하여 DatasourceError 알림을 생성합니다.

알림 규칙에 대한 주석 및 레이블

주석 및 레이블은 알림 규칙, 데이터 소스 응답 및 알림 규칙 평가의 결과에서 비롯된 알림과 연결된 키-값 페어입니다. 알림 전달에서 직접 사용하거나 템플릿템플릿 함수에서 사용하여 알림 연락처를 동적으로 생성할 수 있습니다.

주석

주석은 알림에 대한 추가 정보를 제공하는 키-값 페어입니다. description, summary, runbook_url, alertId, dashboardUid, panelId와 같은 주석을 사용할 수 있습니다. 이는 UI의 규칙 및 알림 세부 정보에 표시되며 연락 지점 메시지 템플릿에서 사용할 수 있습니다.

레이블

레이블은 알림에 대한 정보를 포함하는 키-값 페어입니다. 알림에 대한 레이블 세트가 생성되고 알림 평가 및 알림 프로세스 전반에 걸쳐 추가됩니다. 다음과 같은 방식으로 사용됩니다.

  • 알림의 전체 레이블 세트를 통해 Grafana 알림 내에서 해당 알림을 고유하게 식별합니다.

  • Alertmanager는 레이블을 사용하여 알림 정책무음알림 그룹에 대한 알림을 매칭합니다.

  • 알림 UI에는 해당 규칙의 평가에서 생성된 모든 알림 인스턴스의 레이블이 표시됩니다.

  • 연락 지점에서는 레이블에 액세스하여 알림을 생성시키는 알림 관련 정보가 포함된 알림을 동적으로 생성할 수 있습니다.

  • 레이블을 알림 규칙에 추가할 수 있습니다. 이와 같이 수동으로 구성된 레이블은 템플릿 함수를 사용하고 다른 레이블을 참조할 수 있습니다. 여기에서 알림 규칙에 추가된 레이블은 레이블 간 충돌이 발생하는 경우 우선됩니다.

주석 및 레이블을 확장할 때 다음 템플릿 변수를 사용할 수 있습니다.

명칭 설명

$labels

쿼리 또는 조건의 레이블. 예: {{ $labels.instance }}{{ $labels.job }}. 규칙이 클래식 조건을 사용하는 경우 사용할 수 없습니다.

$values

이 알림 규칙에 대해 평가된 모든 축소 및 수학 표현식의 값. 예: {{ $values.A }}, {{ $values.A.Labels }}, {{ $values.A.Value }}. 여기서 A는 표현식의 refID입니다. 규칙이 클래식 조건을 사용하는 경우 사용할 수 없습니다.

$value

알림 인스턴스의 값 문자열. 예: [ var='A' labels={instance=foo} value=10 ].

알림 규칙 관리

알림 페이지에는 알림 규칙이 나열됩니다. 기본적으로 규칙은 데이터 소스 유형별로 그룹화됩니다. Grafana 섹션에는 Grafana에서 관리하는 규칙이 나열되고 Cortex/Loki 섹션에는 Prometheus 호환 데이터 소스에 대한 규칙이 나열됩니다. Prometheus 호환 데이터 소스에 대한 알림 규칙은 볼 수 있지만 편집할 수 없습니다.

알림 규칙 보기

Grafana 알림을 사용하면 한 페이지에서 모든 알림을 볼 수 있습니다.

알림 세부 정보를 보는 방법
  1. Grafana 콘솔의 Grafana 메뉴에서 알림(종 모양) 아이콘을 선택하여 알림 페이지를 여세요. 기본적으로 규칙은 데이터 소스 유형별 그룹으로 표시됩니다. 각 알림의 현재 상태를 기준으로 볼 수도 있습니다(다음 텍스트에 자세히 설명함).

  2. 보기 형식에서 원하는 옵션을 선택하여 그룹 보기와 상태 보기 사이를 전환할 수 있습니다.

  3. 해당 행에 대한 자세한 내용을 확인하려면 행 옆의 화살표를 선택합니다. 규칙의 세부 정보에는 규칙 레이블, 주석, 데이터 소스 및 쿼리와 규칙에서 생성되는 알림 인스턴스 목록이 포함됩니다.

그룹 보기

그룹 보기에는 폴더별로 그룹화된 Grafana 알림 규칙과 namespace + group으로 그룹화된 Loki 또는 Prometheus 알림 규칙이 표시됩니다. 이는 규칙 관리를 위한 기본 규칙 목록 보기입니다. 각 그룹을 확장하여 이 그룹의 규칙 목록을 볼 수 있습니다. 규칙을 더 확장하여 세부 정보를 확인합니다. 규칙에서 생성되는 알림 및 작업 버튼을 확장하여 세부 정보를 볼 수도 있습니다.

상태 보기

상태 보기에는 상태별로 그룹화된 알림 규칙이 표시됩니다. 이 보기를 사용하여 어떤 규칙이 어떤 상태에 있는지에 대한 개요를 확인합니다. 각 규칙을 확장하여 세부 정보를 볼 수 있습니다. 작업 버튼 및 이 규칙에서 생성된 모든 알림과 각 알림을 추가로 확장하여 세부 정보를 볼 수 있습니다.

알림 규칙 필터링

알림 페이지에 표시되는 알림 규칙을 여러 가지 방법으로 필터링할 수 있습니다.

  • 데이터 소스 선택을 선택하고 필터링할 데이터 소스를 선택하여 특정 데이터 소스를 쿼리하는 규칙을 표시하도록 필터링할 수 있습니다.

  • 레이블별 검색에서 검색 기준을 선택하여 레이블별로 필터링할 수 있습니다. 일부 샘플 기준에는 environment=production, region=~US|EU, severity!=warning이 포함됩니다.

  • 상태별 알림 필터링을 선택하고 보려는 상태를 선택하여 특정 상태의 규칙을 표시하도록 필터링할 수 있습니다

알림 규칙 편집 또는 삭제

Grafana 관리형 알림 규칙은 규칙을 저장하는 폴더에 대한 편집 권한이 있는 사용자만 편집하거나 삭제할 수 있습니다. 외부 Cortex 또는 Loki 인스턴스에 대한 알림 규칙은 편집자 또는 관리자 역할의 사용자가 편집하거나 삭제할 수 있습니다.

규칙을 편집하거나 삭제하는 방법
  1. 보기, 편집삭제에 대한 규칙 제어가 표시될 때까지 규칙을 확장하세요.

  2. 편집을 선택하여 규칙 생성 페이지를 여세요. 규칙을 생성하는 것과 동일한 방식으로 업데이트하세요. 자세한 내용은 Grafana 관리형 알림 규칙 생성 또는 Cortex 또는 Loki 관리형 알림 규칙 생성의 지침을 참조하세요.

  3. 선택적으로 삭제를 선택하여 규칙을 삭제하세요.

Cortex 또는 Loki 규칙 그룹 및 네임스페이스

규칙을 구성할 수 있습니다. 규칙은 규칙 그룹 내에서 생성되며 규칙 그룹은 네임스페이스로 구성됩니다. 규칙 그룹 내 규칙은 정기적 간격에 따라 순차적으로 실행됩니다. 기본 간격은 1분입니다. Cortex 또는 Loki 네임스페이스 및 규칙 그룹의 이름을 바꾸고 규칙 그룹 평가 간격을 편집할 수 있습니다.

규칙 그룹 또는 네임스페이스를 편집하는 방법
  1. Grafana 콘솔의 Grafana 메뉴에서 알림(종 모양) 아이콘을 선택하여 알림 페이지를 여세요.

  2. 편집하려는 규칙 그룹 또는 네임스페이스 내 규칙으로 이동하세요.

  3. 편집(펜) 아이콘을 선택하세요.

  4. 규칙 그룹 또는 네임스페이스를 변경하세요.

    참고

    네임스페이스의 경우 이름만 편집할 수 있습니다. 규칙 그룹의 경우 이름 또는 그룹의 규칙에 대한 평가 간격을 변경하세요. 예를 들어 1m을 선택하여 규칙을 분당 1회 평가하거나 30s를 선택하여 30초마다 1회 평가할 수 있습니다.

  5. 변경 사항 저장을 선택하세요.