Grafana 경고 규칙 생성 및 관리 - Amazon Managed Grafana

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Grafana 경고 규칙 생성 및 관리

이 설명서 항목은 Grafana 버전 8.x를 지원하는 Grafana 작업 영역을 위해 설계되었습니다.

Grafana 버전 10.x를 지원하는 Grafana 작업 영역에 대한 내용은 을 참조하십시오. Grafana 버전 10에서 작업하기

Grafana 버전 9.x를 지원하는 Grafana 작업 영역에 대한 내용은 을 참조하십시오. Grafana 버전 9에서 작업하기

알림 규칙은 알림 시작 여부를 결정하는 일련의 평가 기준입니다. 규칙은 하나 이상의 쿼리와 표현식, 조건, 평가 빈도, 조건 충족 기간 (선택 사항) 으로 구성됩니다.

쿼리와 표현식이 평가할 데이터세트를 선택하는 동안 조건은 알림이 생성하기 위해 충족하거나 초과해야 하는 임계값을 설정합니다. 간격은 알림 규칙을 평가하는 빈도를 지정합니다. 기간은 구성된 경우 조건을 충족해야 하는 기간을 나타냅니다. 또한 규칙은 데이터가 없는 경우의 알림 동작을 정의할 수 있습니다.

다음 섹션에서는 다양한 종류의 Grafana 경고 규칙을 만들고 관리하는 방법에 대해 설명합니다.

Cortex 또는 Loki 관리형 알림 규칙 생성

Grafana를 사용하면 외부 Cortex 또는 Loki 인스턴스에 대한 경고 규칙을 만들 수 있습니다.

참고

Cortex는 Amazon Managed Service에서 프로메테우스 및 프로메테우스 데이터 소스용으로 사용하는 시계열 데이터베이스입니다.

사전 조건

  • Prometheus 데이터 소스에 대한 쓰기 권한이 있는지 확인하십시오. 그렇지 않으면 Cortex 관리형 알림 규칙을 만들거나 업데이트할 수 없습니다.

  • Cortex 및 Loki 데이터 소스의 경우 해당 서비스를 구성하여 룰러 API를 활성화하십시오.

    • Loki — Loki 데이터 소스의 기본값인 local 규칙 저장소 유형은 규칙 보기만 지원합니다. 규칙을 편집하려면 다른 저장소 유형 중 하나를 구성하십시오.

    • Cortex — 레거시 /api/prom 접두사는 사용하고, 사용하지 마십시오. /prometheus 프로메테우스 데이터 소스는 코텍스와 프로메테우스를 모두 지원하며, Grafana는 쿼리 API와 룰러 API가 모두 동일한 URL에 속할 것으로 예상합니다. 룰러 API에는 별도의 URL을 제공할 수 없습니다.

참고

특정 Loki 또는 Prometheus 데이터 소스에 대한 알림 규칙을 관리하지 않으려면 해당 설정으로 이동하여 알림 UI를 통한 알림 관리 확인란의 선택을 취소하십시오.

Cortex 또는 Loki 관리형 알림 규칙을 추가하려면
  1. Grafana 콘솔의 Grafana 메뉴에서 알림 (벨) 아이콘을 선택하여 기존 알림을 나열하는 알림 페이지를 엽니다.

  2. 새 알림 규칙을 선택합니다.

  3. 1단계에서 다음과 같이 규칙 이름, 유형 및 저장 위치를 추가합니다.

    • 규칙 이름에 설명이 포함된 이름을 추가합니다. 이 이름은 경고 규칙 목록에 표시됩니다. 이 규칙에서 생성되는 모든 경고 인스턴스의 alertname 레이블이기도 합니다.

    • 규칙 유형 드롭다운에서 Cortex/Loki 관리형 알림을 선택합니다.

    • 데이터 원본 선택 드롭다운에서 Prometheus 또는 Loki 데이터 원본을 선택합니다.

    • 네임스페이스 드롭다운에서 기존 규칙 네임스페이스를 선택합니다. 그렇지 않으면 Add new (새로 추가) 를 선택하고 이름을 입력하여 새로 만드십시오. 네임스페이스는 하나 이상의 규칙 그룹을 포함할 수 있으며 조직적인 용도로만 사용됩니다. 자세한 정보는 Cortex 또는 Loki 규칙 그룹 및 네임스페이스을 참조하세요.

    • 그룹 드롭다운에서 선택한 네임스페이스 내의 기존 그룹을 선택합니다. 그렇지 않으면 Add new (새로 추가) 를 선택하고 이름을 입력하여 새로 만드십시오. 새로 만든 규칙이 그룹 끝에 추가됩니다. 그룹 내 규칙은 동일한 평가 시간을 기준으로 일정한 간격으로 순차적으로 실행됩니다.

  4. 2단계에서 평가할 쿼리를 추가합니다.

    값은 PromQL 또는 LogQL 표현식일 수 있습니다. 평가 결과에 값이 0보다 큰 시리즈가 하나 이상 있는 경우 규칙이 경고를 시작합니다. 각 시리즈에 대해 알림이 생성됩니다.

  5. 3단계에서 조건을 추가합니다.

    조건의 대상 텍스트 상자에 알림이 시작되기 전에 조건이 충족되어야 하는 기간을 지정합니다. 지정하는 5m 경우 알림이 시작되기 전 5분 동안 조건이 충족되어야 합니다.

    참고

    조건이 충족되면 알림이 Pending 상태로 전환됩니다. 지정된 기간 동안 조건이 활성 상태로 유지되면 경고는 해당 Firing 상태로 전환됩니다. 더 이상 충족되지 않으면 상태로 되돌아갑니다. Normal

  6. 4단계에서 규칙과 관련된 메타데이터를 추가합니다.

    • 설명과 요약을 추가하여 경고 메시지를 사용자 지정합니다. 에서 지침을 사용하십시오경고 규칙용 주석 및 레이블.

    • 런북 URL, 패널, 대시보드, 알림 ID를 추가합니다.

    • 사용자 지정 레이블을 추가합니다.

  7. 미리 보기 알림을 선택하여 규칙을 평가하고 어떤 알림이 생성되는지 확인하세요. 각 알림 상태 및 값이 포함된 알림 목록이 표시됩니다.

  8. 저장을 선택하여 규칙을 저장하거나 저장 후 종료를 선택하여 규칙을 저장하고 알림 페이지로 돌아가십시오.

Cortex 또는 Loki 관리 녹화 규칙 만들기

외부 Cortex 또는 Loki 인스턴스에 대한 기록 규칙을 생성하고 관리할 수 있습니다. 기록 규칙은 자주 필요한 표현식이나 계산 비용이 많이 드는 식을 미리 계산하고 결과를 새로운 시계열 집합으로 저장합니다. 이 새 시계열을 쿼리하면 특히 대시보드를 새로 고칠 때마다 동일한 식을 쿼리하므로 대시보드의 경우 더 빠릅니다.

사전 조건

Cortex 및 Loki 데이터 원본의 경우 해당 서비스를 구성하여 ruler API를 활성화하십시오.

  • Loki — Loki 데이터 소스의 기본값인 local 규칙 저장소 유형은 규칙 보기만 지원합니다. 규칙을 편집하려면 다른 저장소 유형 중 하나를 구성하십시오.

  • 코르텍스 — Grafana Prometheus 데이터 소스가 코르텍스를 가리키도록 구성할 때는 레거시 접두사를 사용하고, 사용하지 마십시오. /api/prom /prometheus 프로메테우스 데이터 소스는 코텍스와 프로메테우스를 모두 지원하며, Grafana는 쿼리 API와 룰러 API가 모두 동일한 URL에 속할 것으로 예상합니다. 룰러 API에는 별도의 URL을 제공할 수 없습니다.

참고

특정 Loki 또는 Prometheus 데이터 소스에 대한 알림 규칙을 관리하지 않으려면 해당 설정으로 이동하여 알림 UI를 통한 알림 관리 확인란의 선택을 취소하십시오.

Cortex 또는 Loki 관리 녹화 규칙을 추가하려면
  1. Grafana 콘솔의 Grafana 메뉴에서 알림 (벨) 아이콘을 선택하여 기존 알림을 나열하는 알림 페이지를 엽니다.

  2. 새 알림 규칙을 선택합니다.

  3. 1단계에서 다음과 같이 규칙 이름, 유형 및 저장 위치를 추가합니다.

    • 규칙 이름에 설명이 포함된 이름을 추가합니다. 이 이름은 경고 규칙 목록에 표시됩니다. 이 규칙에서 생성되는 모든 경고 인스턴스의 alertname 레이블이기도 합니다.

    • 규칙 유형 드롭다운에서 Cortex/Loki 관리형 알림을 선택합니다.

    • 데이터 원본 선택 드롭다운에서 Prometheus 또는 Loki 데이터 원본을 선택합니다.

    • 네임스페이스 드롭다운에서 기존 규칙 네임스페이스를 선택합니다. 그렇지 않으면 Add new (새로 추가) 를 선택하고 이름을 입력하여 새로 만드십시오. 네임스페이스는 하나 이상의 규칙 그룹을 포함할 수 있으며 조직적인 용도로만 사용됩니다. 자세한 정보는 Cortex 또는 Loki 규칙 그룹 및 네임스페이스을 참조하세요.

    • 그룹 드롭다운에서 선택한 네임스페이스 내의 기존 그룹을 선택합니다. 그렇지 않으면 Add new (새로 추가) 를 선택하고 이름을 입력하여 새로 만드십시오. 새로 만든 규칙이 그룹 끝에 추가됩니다. 그룹 내 규칙은 동일한 평가 시간을 기준으로 일정한 간격으로 순차적으로 실행됩니다.

  4. 2단계에서 평가할 쿼리를 추가합니다.

    값은 PromQL 또는 LogQL 표현식일 수 있습니다. 평가 결과에 값이 0보다 큰 시리즈가 하나 이상 있는 경우 규칙이 경고를 시작합니다. 각 시리즈에 대해 알림이 생성됩니다.

  5. 3단계에서 규칙과 관련된 메타데이터를 추가합니다.

    • 설명과 요약을 추가하여 경고 메시지를 사용자 지정합니다. 에서 지침을 사용하십시오경고 규칙용 주석 및 레이블.

    • 런북 URL, 패널, 대시보드, 알림 ID를 추가합니다.

    • 사용자 지정 레이블을 추가합니다.

  6. 저장을 선택하여 규칙을 저장하거나 저장 후 종료를 선택하여 규칙을 저장하고 알림 페이지로 돌아가십시오.

Grafana 관리형 알림 규칙 생성

Grafana를 사용하면 하나 이상의 데이터 소스를 쿼리하고, 결과를 줄이거나 변환하고, 서로 비교하거나, 임계값을 수정하는 경고 규칙을 만들 수 있습니다. 이러한 작업이 처리되면 Grafana는 연락처로 알림을 보냅니다.

참고

Grafana 알림을 사용하는 동안 Grafana 관리형 알림 규칙을 생성하면 규칙이 일치할 때 여러 알림이 전송됩니다. 일부 컨택 포인트 제공업체는 알림 중복 제거를 위한 구성 가능한 옵션을 제공할 수 있습니다.

Grafana 관리형 규칙을 추가하려면
  1. Grafana 콘솔의 Grafana 메뉴에서 알림 (벨) 아이콘을 선택하여 기존 알림을 나열하는 알림 페이지를 엽니다.

  2. 새 알림 규칙을 선택합니다.

  3. 1단계에서 다음과 같이 규칙 이름, 유형 및 저장 위치를 추가합니다.

    • 규칙 이름에 설명이 포함된 이름을 추가합니다. 이 이름은 경고 규칙 목록에 표시됩니다. 이 규칙에서 생성되는 모든 경고 인스턴스의 alertname 레이블이기도 합니다.

    • 규칙 유형 드롭다운에서 Grafana 관리형 알림을 선택합니다.

    • 폴더 드롭다운에서 규칙을 저장할 폴더를 선택합니다. 폴더를 선택하지 않으면 규칙이 General 폴더에 저장됩니다. 폴더를 만들려면 드롭다운을 선택하고 새 폴더 이름을 입력합니다.

  4. 2단계에서 평가할 쿼리와 식을 추가합니다.

    • 기본 이름을 그대로 사용하거나 커서로 가리킨 다음 편집 아이콘을 선택하여 이름을 변경합니다.

    • 쿼리의 경우 드롭다운에서 데이터 소스를 선택합니다.

    • 하나 이상의 쿼리 또는 표현식을 추가합니다 (표현식에 대한 자세한 내용은 Grafana 설명서의 표현식 참조).

    • 각 표현식에 대해 클래식 조건을 선택하여 단일 경고 규칙을 만들거나 Math, Reduce, Resample 옵션 중에서 선택하여 시리즈별로 별도의 알림을 생성합니다. 이러한 옵션에 대한 자세한 내용은 을 참조하십시오단일 및 다차원 규칙.

    • 쿼리 실행을 선택하여 쿼리가 성공했는지 확인합니다.

  5. 3단계에서 조건을 추가합니다.

    • 조건 드롭다운에서 알림 규칙을 시작할 쿼리 또는 표현식을 선택합니다.

    • 평가 개수에 대해 평가 빈도를 지정합니다. 10초의 배수여야 합니다. 예, 1m, 30s.

    • 평가 기간에는 경고가 시작되기 전에 조건이 충족되어야 하는 기간을 지정합니다.

      참고

      조건 위반이 발생한 후 경고는 상태가 됩니다. Pending 지정된 기간 동안 조건 위반이 계속되면 경고는 해당 상태로 전환됩니다. Firing 더 이상 충족되지 않으면 상태로 되돌아갑니다. Normal

    • 데이터 없음 및 오류 처리 구성에서 데이터가 없을 때의 알림 동작을 구성합니다. 에서 지침을 사용하십시오. 데이터 없음 또는 오류 사례 처리

    • 지금 쿼리 실행 결과를 확인하려면 알림 미리 보기를 선택합니다. 미리보기는 데이터 없음 및 오류 처리 조건을 제외합니다.

  6. 4단계에서 규칙과 관련된 메타데이터를 추가합니다.

    • 설명과 요약을 추가하여 경고 메시지를 사용자 지정합니다. 에서 지침을 사용하십시오경고 규칙용 주석 및 레이블.

    • 런북 URL, 패널, 대시보드, 알림 ID를 추가합니다.

    • 사용자 지정 레이블을 추가합니다.

  7. 저장을 선택하여 규칙을 저장하거나 저장 후 종료를 선택하여 규칙을 저장하고 알림 페이지로 돌아가십시오.

단일 및 다차원 규칙

Grafana 관리형 알림 규칙의 경우 클래식 조건으로 규칙을 생성하거나 다차원 규칙을 생성할 수 있습니다.

1차원 규칙 (클래식 조건)

클래식 조건 표현식을 사용하여 조건이 충족될 때 단일 경고를 시작하는 규칙을 만들 수 있습니다. 여러 시리즈를 반환하는 쿼리의 경우 Grafana는 각 시리즈의 알림 상태를 추적하지 않습니다. 따라서 Grafana는 여러 시리즈의 알림 조건이 충족되는 경우에도 단일 알림만 전송합니다.

표현식의 형식을 지정하는 방법에 대한 자세한 내용은 Grafana 설명서의 표현식을 참조하십시오.

다차원 규칙

쿼리에서 반환된 각 시리즈에 대해 별도의 경고 인스턴스를 생성하려면 다차원 규칙을 생성하십시오.

참고

다차원 규칙으로 생성된 각 경고 인스턴스는 총 경고 할당량에 포함됩니다. 알림 할당량에 도달하면 규칙이 평가되지 않습니다. 다차원 규칙의 할당량에 대한 자세한 내용은 을 참조하십시오. 할당량 도달 오류

단일 규칙에서 여러 인스턴스를 만들려면 MathReduce, 또는 Resample 식을 사용하여 다차원 규칙을 만드십시오. 예를 들어, 다음을 수행할 수 있습니다.

  • 각 쿼리에 Reduce 식을 추가하여 선택한 시간 범위의 값을 단일 값으로 집계합니다. (숫자 데이터를 사용하는 규칙에는 필요하지 않음).

  • 규칙 조건이 포함된 Math 표현식을 추가합니다. 쿼리 또는 reduce 표현식이 이미 0을 반환하고 규칙이 경고를 시작하지 않아야 하는 경우 양수를 반환하는 경우에는 이 방법이 필요하지 않습니다.

    다음은 일부 예입니다.

    • $B > 70B 쿼리/표현식의 값이 70을 초과하는 경우 알림을 시작해야 하는지 여부

    • $B < $C * 100B 값이 C 값에 100을 곱한 값보다 작으면 알림을 시작해야 하는 경우 비교 대상 쿼리 결과에 여러 시리즈가 있는 경우 레이블이 같거나 한 쿼리가 다른 쿼리의 하위 집합이면 서로 다른 쿼리의 시리즈가 일치됩니다.

참고

Grafana는 템플릿 변수를 사용한 경고 쿼리를 지원하지 않습니다. 자세한 내용은 커뮤니티 페이지에서 확인할 수 있습니다. 알림을 설정하는 동안 템플릿 변수는 알림 쿼리에서 지원되지 않습니다.

다차원 규칙에 대한 성능 고려 사항

각 알림 인스턴스는 알림 할당량에 포함됩니다. 알림 할당량 내에서 수용할 수 있는 것보다 많은 인스턴스를 생성하는 다차원 규칙은 평가되지 않으며 할당량 오류를 반환합니다. 자세한 정보는 할당량 도달 오류을 참조하세요.

다차원 경고는 Grafana 작업 공간의 성능뿐만 아니라 Grafana가 데이터 소스를 쿼리하여 경고 규칙을 평가할 때 데이터 소스의 성능에도 큰 영향을 미칠 수 있습니다. 모니터링 시스템의 성능을 최적화하려는 경우 다음 고려 사항이 유용할 수 있습니다.

  • 규칙 평가 빈도 - 경고 규칙의 모든 평가 속성은 규칙 평가 빈도를 제어합니다. 허용 가능한 가장 낮은 평가 빈도를 사용하는 것이 좋습니다.

  • 결과 세트 카디널리티 — 규칙을 사용하여 생성하는 경고 인스턴스의 수가 성능에 영향을 줍니다. 플릿의 모든 VM에서 모든 API 경로에 대한 API 응답 오류를 모니터링한다고 가정해 보겠습니다. 이 세트에는 경로 수에 VM 수를 곱한 카디널리티가 있습니다. 예를 들어 VM별 경로별 대신 VM별 총 오류를 모니터링하여 결과 집합의 카디널리티를 줄일 수 있습니다.

  • 쿼리의 복잡성 — 데이터 소스가 신속하게 처리하고 응답할 수 있는 쿼리는 리소스를 덜 소모합니다. 이 고려 사항이 위에 나열된 다른 고려 사항보다 덜 중요하긴 하지만 이러한 고려 사항을 최대한 줄였다면 개별 쿼리 성능을 살펴보는 것이 차이를 만들 수 있습니다. 또한 이러한 규칙을 평가하는 것이 데이터 원본에 미치는 성능 영향도 알고 있어야 합니다. 알림 쿼리는 모니터링 데이터베이스에서 처리되는 대부분의 쿼리인 경우가 많으므로 Grafana 인스턴스에 영향을 미치는 동일한 로드 팩터가 알림 쿼리에도 영향을 미칩니다.

할당량 도달 오류

단일 작업 영역 내에 포함할 수 있는 경고 인스턴스 수에는 할당량이 있습니다. 이 수에 도달하면 해당 작업 영역에서 더 이상 새 알림 규칙을 만들 수 없습니다. 다차원 경고의 경우 경고 인스턴스의 수는 시간이 지남에 따라 달라질 수 있습니다.

경고 인스턴스로 작업할 때 다음 사항을 기억해야 합니다.

  • 1차원 규칙만 생성하는 경우 각 규칙은 단일 경고 인스턴스가 됩니다. 알림 인스턴스 할당량과 동일한 수의 규칙을 단일 작업 영역에 생성할 수 있으며 그 이상은 만들 수 없습니다.

  • 다차원 규칙은 여러 경고 인스턴스를 생성하지만 평가 전에는 그 수를 알 수 없습니다. 예를 들어 Amazon EC2 인스턴스의 CPU 사용량을 추적하는 알림 규칙을 생성하면 생성 시 EC2 인스턴스가 50개 (즉, 경고 인스턴스 50개) 있을 수 있지만, 일주일 후에 EC2 인스턴스 10개를 더 추가하면 다음 평가 시 경고 인스턴스가 60개일 수 있습니다.

    알림 인스턴스의 수는 다차원 알림을 생성할 때 평가되며, 알림 인스턴스 할당량을 즉시 초과하는 인스턴스를 생성할 수는 없습니다. 알림 인스턴스의 수는 변경될 수 있으므로 규칙을 평가할 때마다 할당량을 확인합니다.

  • 규칙 평가 시 규칙으로 인해 경고 인스턴스의 할당량을 초과한 경우 총 경고 인스턴스 수가 서비스 할당량 이하로 되도록 경고 규칙을 업데이트하기 전까지는 해당 규칙이 평가되지 않습니다. 이 경우 할당량에 도달했음을 알리는 경고 알림을 받게 됩니다. 알림은 평가 대상 규칙에 대한 알림 정책을 사용합니다. 알림에는 값이 있는 Error 주석이 포함되어 있습니다. QuotaReachedError

  • 평가를 QuotaReachedError 중단시키는 규칙. 업데이트가 수행된 경우에만 평가가 재개되며 업데이트 후 평가 자체로 QuotaReachedError a가 발생하지 않습니다. 평가되지 않는 규칙은 Grafana 콘솔에서 할당량 도달 오류를 표시합니다.

  • 경고 규칙을 제거하거나 경고 인스턴스 수를 줄이도록 다차원 경고를 편집하여 알림 인스턴스 수를 줄일 수 있습니다 (예: VM에서 API당 오류에 대한 경고 하나가 아니라 VM당 하나의 오류에 대한 경고를 표시하는 방법).

  • 평가를 재개하려면 알림을 업데이트하고 저장하십시오. 알림 인스턴스 수를 줄이도록 업데이트하거나 알림 인스턴스 수를 줄이기 위해 다른 변경을 수행한 경우 변경 없이 저장할 수 있습니다. 재개할 수 있다면 재개할 수 있습니다. 이로 인해 다른 QuotaReachedError 문제가 발생하면 저장할 수 없습니다.

  • 알림이 저장되고 경고 할당량을 초과하지 않고 평가를 재개하면 할당량 도달 오류가 Grafana 콘솔에 일정 시간 (평가 간격까지) 계속 표시될 수 있지만 경고 규칙 평가가 시작되고 규칙 임계값이 충족되면 경고가 전송됩니다.

  • 알림 할당량 및 기타 할당량에 대한 자세한 내용은 을 참조하십시오. 아마존 매니지드 Grafana 서비스 할당량

데이터 없음 또는 오류 사례 처리

데이터가 없거나 오류가 있을 때 알림 동작을 처리하는 방법에 대한 옵션을 선택합니다.

데이터 없음 처리 옵션은 다음 표에 나열되어 있습니다.

데이터 없음 옵션 동작

데이터 없음

알림 규칙의 이름과 UID, DatasourceNoData 레이블로 데이터를 반환하지 않은 데이터 소스의 UID를 사용하여 알림을 생성합니다.

알림

알림 규칙 상태를 로 설정합니다. Alerting

정상

경고 규칙 상태를 로 설정합니다Normal.

오류 사례 처리 옵션은 다음 표에 나열되어 있습니다.

오류 또는 타임아웃 옵션 동작

알림

경고 규칙 상태를 다음과 같이 설정합니다. Alerting

정상

알림 규칙 상태를 다음과 같이 설정합니다. Normal

Error

경고 규칙의 이름과 UID, DatasourceError 레이블로 데이터를 반환하지 않은 데이터 원본의 UID를 사용하여 알림을 생성합니다.

경고 규칙용 주석 및 레이블

주석과 레이블은 경고 규칙, 데이터 소스 응답 및 경고 규칙 평가 결과에서 비롯된 경고와 관련된 키-값 쌍입니다. 알림 알림에 직접 사용하거나 템플릿 및 템플릿 기능에 사용하여 알림 연락처를 동적으로 만들 수 있습니다.

주석

주석은 알림에 대한 추가 정보를 제공하는 키-값 쌍입니다. description,,, summaryrunbook_url, alertId 및 주석을 사용할 수 있습니다. dashboardUid panelId 이러한 정보는 UI의 규칙 및 경고 세부 정보에 표시되며 연락처 메시지 템플릿에 사용할 수 있습니다.

레이블

레이블은 알림에 대한 정보가 포함된 키-값 쌍입니다. 알림에 대한 레이블 세트는 경고 평가 및 알림 프로세스 전반에 걸쳐 생성되고 추가됩니다. 이들은 다음과 같은 방식으로 사용됩니다.

  • 알림의 전체 레이블 세트는 Grafana Alerts 내에서 해당 경고를 고유하게 식별합니다.

  • Alertmanager는 레이블을 사용하여 알림 정책의 무음 및 경고 그룹에 대한 경고를 일치시킵니다.

  • 경고 UI에는 해당 규칙 평가로 생성된 모든 경고 인스턴스의 레이블이 표시됩니다.

  • 연락처는 레이블에 액세스하여 알림을 유발하는 해당 알림과 관련된 정보가 포함된 알림을 동적으로 생성할 수 있습니다.

  • 경고 규칙에 레이블을 추가할 수 있습니다. 수동으로 구성된 이러한 레이블은 템플릿 기능을 사용하고 다른 레이블을 참조할 수 있습니다. 여기서 경고 규칙에 추가된 레이블은 레이블 간에 충돌이 발생할 경우 우선 적용됩니다.

주석과 레이블을 확장할 때 다음 템플릿 변수를 사용할 수 있습니다.

명칭 설명

$labels

쿼리 또는 조건의 레이블. 예: {{ $labels.instance }}{{ $labels.job }}. 규칙이 클래식 조건을 사용하는 경우에는 이 옵션을 사용할 수 없습니다.

$values

이 경고 규칙에 대해 평가된 모든 reduce 및 수학 표현식의 값입니다. 예를 들어 {{ $values.A }}{{ $values.A.Labels }}, refID 표현식의 {{ $values.A.Value }} A 위치는 다음과 같습니다. 규칙이 클래식 조건을 사용하는 경우에는 이 기능을 사용할 수 없습니다.

$value

경고 인스턴스의 값 문자열입니다. 예를 들어 [ var='A' labels={instance=foo} value=10 ]입니다.

알림 규칙 관리

알림 페이지에는 알림 규칙이 나열되어 있습니다. 기본적으로 규칙은 데이터 소스 유형별로 그룹화됩니다. Grafana 섹션에는 Grafana에서 관리하는 규칙이 나열되고 Cortex/Loki 섹션에는 Prometheus 호환 데이터 소스에 대한 규칙이 나열되어 있습니다. Prometheus 호환 데이터 소스에 대한 알림 규칙을 볼 수 있지만 편집할 수는 없습니다.

알림 규칙 보기

Grafana 알림을 사용하면 모든 알림을 한 페이지에서 볼 수 있습니다.

알림 세부 정보를 보려면
  1. Grafana 콘솔의 Grafana 메뉴에서 알림 (벨) 아이콘을 선택하여 알림 페이지를 엽니다. 기본적으로 규칙은 데이터 소스 유형별로 그룹으로 표시됩니다. 각 알림의 현재 상태별로 볼 수도 있습니다 (자세한 내용은 다음 텍스트에 설명되어 있음).

  2. View as에서는 원하는 옵션을 선택하여 그룹 보기와 상태 보기를 전환할 수 있습니다.

  3. 행 옆에 있는 화살표를 선택하면 해당 행에 대한 세부 정보를 더 자세히 볼 수 있습니다. 규칙의 세부 정보에는 규칙 레이블, 주석, 데이터 원본, 쿼리뿐만 아니라 규칙으로 인한 경고 인스턴스 목록이 포함됩니다.

그룹 보기

그룹 보기에는 폴더별로 그룹화된 Grafana 경고 규칙과 +로 그룹화된 Loki 또는 Prometheus 경고 규칙이 표시됩니다. namespace group 규칙 관리를 위한 기본 규칙 목록 보기입니다. 각 그룹을 확장하여 이 그룹의 규칙 목록을 볼 수 있습니다. 규칙을 더 확장하면 세부 정보를 볼 수 있습니다. 규칙으로 인한 작업 버튼 및 경고를 확장하여 세부 정보를 볼 수도 있습니다.

상태 보기

상태 보기에는 상태별로 그룹화된 경고 규칙이 표시됩니다. 이 보기를 사용하면 어떤 규칙이 어떤 상태에 있는지 개괄적으로 볼 수 있습니다. 각 규칙을 확장하여 세부 정보를 볼 수 있습니다. 작업 버튼 및 이 규칙에 의해 생성된 모든 경고, 각 알림을 추가로 확장하여 세부 정보를 볼 수 있습니다.

필터 경고 규칙

알림 페이지에 나타나는 알림 규칙을 여러 가지 방법으로 필터링할 수 있습니다.

  • 데이터 원본 선택을 선택한 다음 필터링 기준으로 사용할 데이터 원본을 선택하여 특정 데이터 원본을 쿼리하는 규칙을 표시하도록 필터링할 수 있습니다.

  • 레이블별 검색에서 검색 기준을 선택하여 레이블별로 필터링할 수 있습니다. 일부 샘플 기준에는 environment=productionregion=~US|EU, 등이 포함됩니다severity!=warning.

  • 상태별 알림 필터링을 선택한 다음 보려는 상태를 선택하여 특정 상태의 규칙을 표시하도록 필터링할 수 있습니다.

알림 규칙 편집 또는 삭제

Grafana 관리형 경고 규칙은 규칙을 저장하는 폴더에 대한 편집 권한이 있는 사용자만 편집하거나 삭제할 수 있습니다. 외부 Cortex 또는 Loki 인스턴스에 대한 경고 규칙은 편집자 또는 관리자 역할을 가진 사용자가 편집하거나 삭제할 수 있습니다.

규칙 편집 또는 삭제하기
  1. 보기, 편집삭제에 대한 규칙 컨트롤이 표시될 때까지 규칙을 확장합니다.

  2. 편집을 선택하여 규칙 생성 페이지를 엽니다. 규칙을 만들 때와 같은 방식으로 업데이트하십시오. 자세한 내용은 Grafana 관리형 알림 규칙 생성 또는 지침을 참조하십시오Cortex 또는 Loki 관리형 알림 규칙 생성.

  3. 원하는 경우 삭제를 선택하여 규칙을 삭제할 수 있습니다.

Cortex 또는 Loki 규칙 그룹 및 네임스페이스

규칙을 구성할 수 있습니다. 규칙은 규칙 그룹 내에 생성되고 규칙 그룹은 네임스페이스로 구성됩니다. 규칙 그룹 내의 규칙은 일정한 간격으로 순차적으로 실행됩니다. 기본 간격은 1분입니다. Cortex 또는 Loki 네임스페이스와 규칙 그룹의 이름을 바꾸고 규칙 그룹 평가 간격을 편집할 수 있습니다.

규칙 그룹 또는 네임스페이스를 편집하려면
  1. Grafana 콘솔의 Grafana 메뉴에서 알림 (벨) 아이콘을 선택하여 알림 페이지를 엽니다.

  2. 편집하려는 규칙 그룹 또는 네임스페이스 내의 규칙으로 이동합니다.

  3. 편집 (펜) 아이콘을 선택합니다.

  4. 규칙 그룹 또는 네임스페이스를 변경합니다.

    참고

    네임스페이스의 경우 이름만 편집할 수 있습니다. 규칙 그룹의 경우 그룹 내 규칙의 이름 또는 평가 간격을 변경합니다. 예를 들어 규칙을 분당 한 번 평가하거나 30초마다 한 번씩 1m 30s 평가하도록 선택할 수 있습니다.

  5. 변경 사항 저장를 선택합니다.