알림 기본 사항 - Amazon Managed Grafana

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

알림 기본 사항

이 설명서 항목은 Grafana 버전 8.x를 지원하는 Grafana 작업 영역을 위해 설계되었습니다.

Grafana 버전 10.x를 지원하는 Grafana 작업 영역에 대한 내용은 을 참조하십시오. Grafana 버전 10에서 작업하기

Grafana 버전 9.x를 지원하는 Grafana 작업 영역에 대한 내용은 을 참조하십시오. Grafana 버전 9에서 작업하기

이 섹션에서는 Grafana 알림의 기본 개념에 대한 정보를 제공합니다.

알림 개념

다음 표는 Grafana 알림의 주요 개념을 설명합니다.

주요 개념 또는 기능 정의

알림용 데이터 소스

쿼리하려는 데이터 소스를 선택하고 지표, 로그 및 추적을 시각화하세요.

스케줄러

알림 규칙, 즉 데이터 소스에 대해 정기적으로 쿼리를 실행하는 구성 요소를 평가합니다. Grafana에서 관리하는 규칙에만 적용됩니다.

알림 관리자

경고 인스턴스의 라우팅 및 그룹화를 관리합니다.

경고 규칙

경고 규칙이 실행되어야 하는 시기에 대한 일련의 평가 기준. 알림 규칙은 하나 이상의 쿼리와 표현식, 조건, 평가 빈도, 조건이 충족되는 기간으로 구성됩니다. 경고 규칙은 여러 경고 인스턴스를 생성할 수 있습니다.

경고 인스턴스

경고 인스턴스는 경고 규칙의 인스턴스입니다. 1차원 경고 규칙에는 경고 인스턴스가 하나 있습니다. 다차원 경고 규칙에는 하나 이상의 경고 인스턴스가 있습니다. 여러 결과와 일치하는 단일 경고 규칙 (예: 10개 VM에 대한 CPU) 은 여러 개의 경고 인스턴스 (이 경우 10개) 로 계산됩니다. 이 수치는 시간에 따라 달라질 수 있습니다. 예를 들어 시스템의 모든 VM에 대한 CPU 사용량을 모니터링하는 경고 규칙에는 VM이 추가됨에 따라 경고 인스턴스가 더 많아집니다. 알림 인스턴스 할당량에 대한 자세한 내용은 을 참조하십시오. 할당량 도달 오류

알림 그룹

Alertmanager는 기본적으로 루트 알림 정책의 레이블을 사용하여 경고 인스턴스를 그룹화합니다. 이를 통해 중복 제거와 연락처로 전송되는 경고 인스턴스 그룹을 제어할 수 있습니다.

컨택 포인트

알림 규칙이 실행될 때 연락처에 알림을 보내는 방법을 정의하십시오.

메시지 템플릿

재사용 가능한 사용자 지정 템플릿을 만들어 연락처에서 사용하세요.

알림 정책

알림을 그룹화하고 연락처로 라우팅하는 위치, 시기 및 방법에 대한 규칙 세트.

라벨 및 라벨 매처

라벨은 알림 규칙을 고유하게 식별합니다. 알림 규칙을 알림 정책 및 무음에 연결하여 이를 처리해야 하는 정책과 차단해야 하는 경고 규칙을 결정합니다.

사일런스

하나 이상의 경고 인스턴스에서 알림을 중지합니다. 무음과 음소거 타이밍의 차이는 무음이 지정된 시간 동안 지속되며, 이때 음소거 타이밍은 반복되는 일정에 따라 발생한다는 것입니다. 레이블 매처를 사용하여 경고 인스턴스를 무음으로 설정합니다.

뮤트 타이밍

새 알림을 생성하거나 전송하지 않으려는 시간 간격을 지정하세요. 유지 관리 기간과 같이 반복되는 기간 동안 알림 알림을 중지할 수 있습니다. 기존 알림 정책에 연결되어야 합니다.

알림 데이터 소스

Grafana 관리형 알림은 알림이 활성화된 다음 백엔드 데이터 소스를 쿼리합니다.

  • Grafana가 내장하거나 개발 및 유지 관리하는 데이터 소스Alertmanager:Graphite, Prometheus (Prometheus용 아마존 매니지드 서비스 포함)Loki,,,,,,,,,,InfluxDB, Amazon OpenSearch ServiceGoogle Cloud Monitoring, Amazon CloudWatch 및. Azure Monitor MySQL PostgreSQL MSSQL OpenTSDB Oracle Azure Monitor

수치 데이터에 대한 알림

시계열 형식이 아닌 숫자 데이터는 직접 알림을 받거나 서버측 표현식으로 전달할 수 있습니다. 이를 통해 데이터 원본 내에서 처리 및 효율성이 향상되고 알림 규칙을 단순화할 수 있습니다. 시계열 데이터 대신 수치 데이터에 대해 경고를 보내는 경우 레이블이 지정된 각 시계열을 단일 숫자로 줄일 필요가 없습니다. 대신 레이블이 지정된 숫자가 Grafana에 반환됩니다.

테이블 형식 데이터

이 기능은 MySQL, Postgres, MSSQL 및 Oracle과 같은 SQL 데이터 소스를 포함하여 테이블 형식 데이터를 쿼리하는 백엔드 데이터 원본에서 지원됩니다.

Grafana 관리 알림 또는 서버 측 표현식을 사용하는 쿼리는 다음 데이터 소스에서 숫자로 간주됩니다.

  • 데이터 소스 Format AS Table 쿼리에서 옵션이 로 설정된 경우

  • 쿼리에서 Grafana로 반환된 테이블 응답에 하나의 숫자 (예: int, double 또는 float) 열과 선택적으로 추가 문자열 열이 포함된 경우

문자열 열이 있는 경우 해당 열이 레이블이 됩니다. 열 이름은 레이블 이름이 되고 각 행의 값은 해당 레이블의 값이 됩니다. 여러 행이 반환되는 경우 레이블로 각 행을 고유하게 식별해야 합니다.

디스크스페이스라는 MySQL 테이블이 있는 경우 다음과 같습니다.

Time Host 디스크 PercentFree

2021-6월 - 7일

웹1

/기타

3

2021-6월 7일

웹2

/var

4

2021-6월 7일

웹3

/var

8

시계열을 Grafana에 반환하지 않고도 정시에 데이터 필터링을 쿼리할 수 있습니다. 예를 들어 여유 공간이 5% 미만일 때 호스트, 디스크별로 시작되는 알림은 다음과 같습니다.

SELECT Host, Disk, CASE WHEN PercentFree < 5.0 THEN PercentFree ELSE 0 END FROM ( SELECT Host, Disk, Avg(PercentFree) FROM DiskSpace Group By Host, Disk Where __timeFilter(Time)

이 쿼리는 Grafana에 대한 다음 테이블 응답을 반환합니다.

Host 디스크 PercentFree

web1

/기타

3

웹2

/var

4

웹3

/var

0

이 쿼리를 경고 규칙의 조건으로 사용하면 값이 0이 아닌 알림인 경우가 발생합니다. 그 결과 다음 표와 같이 세 개의 경고 인스턴스가 생성됩니다.

레이블 상태 표시기

{호스트=웹1, 디스크=/기타}

알림

{호스트=웹2, 디스크=/var}

알림

{호스트=웹3, 디스크=/var}

정상

알림 관리자

Grafana에는 Prometheus Alertmanager에 대한 지원이 내장되어 있습니다. Alertmanager는 알림 엔진 위에 오케스트레이션 계층을 추가하여 경고 규칙을 그룹화하고 관리하는 데 모두 도움이 됩니다. 기본적으로 Grafana 관리 알림에 대한 알림은 코어 Grafana의 일부인 내장된 Alertmanager에서 처리합니다. Alertmanager 드롭다운에서 Grafana 옵션을 선택하여 Grafana 알림 UI에서 Alertmanager의 연락처, 알림 정책 및 템플릿을 구성할 수 있습니다.

Grafana 알림은 외부 Alertmanager 구성을 지원합니다 (외부 데이터 소스로서의 Alertmanager에 대한 자세한 내용은 참조). Alertmanager 데이터 소스에 연결 외부 Alertmanager를 추가하면 Alertmanager 드롭다운에 사용 가능한 외부 Alertmanager 데이터 소스 목록이 표시됩니다. 독립형 Cortex 또는 Loki 데이터 소스에 대한 알림을 생성하고 관리할 데이터 소스를 선택합니다.

알림 규칙의 상태 및 상태

알림 규칙의 상태 및 상태는 알림에 대한 몇 가지 주요 상태 지표를 이해하는 데 도움이 됩니다. 경고 상태, 경고 규칙 상태, 경고 규칙 상태라는 세 가지 주요 구성 요소가 있습니다. 각 구성 요소는 서로 관련이 있지만 전달하는 정보는 약간씩 다릅니다.

경고 규칙 상태

  • 정상 — 평가 엔진에서 반환한 시계열 중 Pending or Firing 상태에 있는 시계열이 없습니다.

  • 보류 중 - 평가 엔진에서 반환한 시계열 중 하나 이상이 입니다Pending.

  • 실행 — 평가 엔진에서 반환한 시계열 중 하나 이상이 입니다Firing.

경고 상태

  • 정상 - 평가 엔진에서 반환되는 모든 시계열에 대한 경고 규칙 조건은 false입니다.

  • 경고 - 평가 엔진에서 반환한 하나 이상의 시계열에 대한 경고 규칙의 조건이 true입니다. 조건이 충족되어야 하는 기간 (설정된 경우) 이 충족되거나 경고가 초과된 경우 경고가 시작되기 전까지 지속되는 기간입니다.

  • 보류 중 - 평가 엔진에서 반환한 하나 이상의 시계열에 대한 경고 규칙 조건이 true입니다. 알림이 시작되기 전까지 조건이 충족되어야 하는 기간 (설정된 경우) 이 충족되지 않은 경우

  • NoData— 경고 규칙이 시계열을 반환하지 않았거나, 시계열에 대한 모든 값이 null이거나, 시계열에 대한 모든 값이 0입니다.

  • 오류 — 알림 규칙을 평가하려고 할 때 오류가 발생했습니다.

알림 규칙 상태

  • 확인 — 경고 규칙을 평가할 때 오류가 없습니다.

  • 오류 - 알림 규칙을 평가하는 중 오류가 발생했습니다.

  • NoData— 규칙 평가 중에 반환된 하나 이상의 시계열에 데이터가 없는 경우.