알림 정책 - Amazon Managed Grafana

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

알림 정책

이 설명서 항목은 Grafana 버전 10.x를 지원하는 Grafana 작업 영역을 위해 설계되었습니다.

Grafana 버전 9.x를 지원하는 Grafana 작업 영역에 대해서는 을 참조하십시오. Grafana 버전 9에서 작업하기

Grafana 버전 8.x를 지원하는 Grafana 작업 영역에 대해서는 을 참조하십시오. Grafana 버전 8에서 작업하기

알림 정책은 다양한 수신기로 경고를 라우팅하는 유연한 방법을 제공합니다. 라벨 매처를 사용하면 모든 개별 경고 규칙을 업데이트하지 않고도 경고 알림 전달을 수정할 수 있습니다.

이 섹션에서는 알림 정책 설정을 최대한 활용할 수 있도록 알림 정책의 작동 방식과 구조에 대해 자세히 알아봅니다.

정책 트리

알림 정책은 목록이 아니라 트리 구조에 따라 구조화됩니다. 즉, 각 정책에 하위 정책 등이 포함될 수 있습니다. 알림 정책 트리의 루트를 기본 알림 정책이라고 합니다.

각 정책은 처리할 레이블과 처리하지 않으려는 레이블을 지정하는 레이블 매처 집합 (0개 이상) 으로 구성됩니다.

레이블 매칭에 대한 자세한 내용은 을 참조하십시오라벨 매칭 작동 방식.

참고

알림 정책에 레이블 매처를 구성하지 않은 경우 알림 정책은 모든 경고 인스턴스와 일치합니다. 이렇게 하면 알림 정책에서 형제 그룹 계속 매칭을 활성화하지 않는 한 하위 정책이 평가되지 않을 수 있습니다.

라우팅

어떤 알림 정책이 어떤 알림 인스턴스를 처리할지 결정하려면 먼저 기본 알림 정책부터 시작하여 기존 알림 정책 세트를 살펴봐야 합니다.

기본 정책 이외의 정책이 구성되어 있지 않은 경우 기본 정책이 알림 인스턴스를 처리합니다.

기본 정책 이외의 정책이 정의된 경우 표시된 순서대로 해당 알림 정책을 평가합니다.

알림 정책에 경고 인스턴스의 레이블과 일치하는 레이블 매처가 있는 경우 해당 하위 정책으로 이어지며, 있는 경우 하위 정책이 더 이상 발견되지 않을 때까지 레이블 집합의 범위를 좁히는 레이블 매처가 있을 수 있는 하위 정책을 계속 찾는 식입니다.

알림 정책에 하위 정책이 정의되어 있지 않거나 하위 정책에 경고 인스턴스의 레이블과 일치하는 레이블 매처가 없는 경우 상위 알림 정책이 사용됩니다.

일치하는 정책을 찾자마자 시스템은 일치하는 다른 정책을 계속 찾지 않습니다. 일치할 수 있는 다른 정책을 계속 찾으려면 해당 특정 정책에서 형제 정책 계속 매칭을 활성화하십시오.

마지막으로, 알림 정책을 선택하지 않은 경우 기본 알림 정책이 사용됩니다.

라우팅 예제

다음은 비교적 간단한 알림 정책 트리와 일부 경고 인스턴스의 예입니다.

트리 구조의 알림 정책 세트와 정책에 맞게 레이블이 서로 다른 경고 인스턴스 세트를 보여 주는 이미지입니다.

이러한 정책을 선택하는 방법을 자세히 살펴보면 다음과 같습니다.

꽂힌 포드에는 severity 레이블이 없으므로 해당 어린이 정책이 하나도 일치하지 CrashLoop 않습니다. team=operations레이블이 있으므로 첫 번째 정책이 일치합니다.

이미 일치하는 항목을 찾았고 해당 team=security 정책에 대해 형제 그룹 계속 매칭이 구성되지 않았으므로 정책이 평가되지 않습니다.

디스크 사용량 — 80%team a와 severity 레이블을 모두 포함하고 있으며 운영팀의 하위 정책과 일치합니다.

무단 로그 입력은 team 레이블이 있지만 값이 동일하지 않기 때문에 첫 번째 정책 (team=operations) 과 일치하지 않습니다. 따라서 계속 검색하여 team=security 정책과 일치시킵니다. 하위 정책이 없으므로 추가 severity=high 레이블은 무시됩니다.

상속

하위 정책은 경고 인스턴스를 라우팅하는 데 유용한 개념일 뿐만 아니라 상위 정책의 속성도 상속합니다. 이는 기본 알림 정책의 하위 정책인 모든 정책에도 적용됩니다.

다음 속성은 하위 정책에 상속됩니다.

  • 연락처

  • 그룹화 옵션

  • 타이밍 옵션

  • 음소거 타이밍

상속된 속성을 재정의하려는 경우 개별 정책으로 이러한 각 속성을 덮어쓸 수 있습니다.

상위 정책에서 연락처를 상속하려면 해당 연락처를 비워 두십시오. 상속된 그룹화 옵션을 재정의하려면 그룹화 재정의를 활성화합니다. 상속된 타이밍 옵션을 재정의하려면 일반 타이밍 재정의를 활성화합니다.

상속 예제

아래 예는 이전 예제의 알림 정책 트리를 통해 의 하위 정책이 해당 연락처를 team=operations 상속하도록 허용하는 방법을 보여줍니다.

이렇게 하면 각 하위 정책에 대해 동일한 연락처를 여러 번 지정하지 않아도 됩니다.

일련의 알림 정책을 트리 구조로 보여 주는 이미지입니다. 일부 정책에는 연락처가 할당되어 있지만 일부 아동 정책은 부모의 연락처를 직접 정의하는 대신 부모의 연락처를 상속합니다.

추가 구성 옵션

그룹화

그룹화는 관련 알림을 더 적은 수의 알림으로 일괄 처리할 수 있으므로 Grafana Alerting의 중요한 기능입니다. 이는 대기 중인 엔지니어와 같이 단기간에 많은 알림을 받는 것이 부담스러울 수 있고 경우에 따라 최초 대응 요원의 사고 대응 능력에 부정적인 영향을 미칠 수 있는 최초 대응자에게 알림이 전달되는 경우 특히 중요합니다. 예를 들어, 많은 시스템이 다운되어 대규모 정전이 발생한 경우를 생각해 보십시오. 이 경우 그룹화는 전화 1통 수신과 100건의 전화 통화 간의 차이가 될 수 있습니다.

알림 정책의 그룹화 기준 옵션을 사용하여 알림을 그룹화하는 방법을 선택합니다. 기본적으로 Grafana의 알림 정책은 grafana_folder 및 레이블을 사용하여 alertname 경고 규칙별로 경고를 그룹화합니다 (경고 이름이 여러 폴더에서 고유하지 않기 때문). 알림 규칙이 아닌 다른 기준으로 알림을 그룹화하려면 그룹화를 다른 레이블 조합으로 변경하세요.

그룹화 비활성화

모든 알림을 별도의 알림으로 수신하려면 라는 특수 레이블을 기준으로 그룹화하면 됩니다. ... 이는 경보가 최초 대응 시스템 대신 자동화된 시스템으로 전달될 때 유용합니다.

모든 알림을 위한 단일 그룹

모든 알림을 단일 알림으로 함께 수신하려면 Group by를 비워 두면 됩니다.

타이밍 옵션

타이밍 옵션은 각 경고 그룹에 대한 알림 전송 빈도를 결정합니다. 그룹 대기, 그룹 간격, 반복 간격의 세 가지 타이머에 대해 알아야 합니다.

그룹 대기

그룹 대기는 Grafana가 새 알림 그룹에 대한 첫 번째 알림을 보내기 전에 기다리는 시간입니다. 그룹 대기가 길수록 다른 알림이 도착하는 데 걸리는 시간이 길어집니다. 그룹 대기가 짧을수록 첫 번째 알림이 더 빨리 전송되지만 불완전한 알림을 보낼 위험이 있습니다. 항상 사용 사례에 가장 적합한 그룹 대기를 선택해야 합니다.

기본값은 30초입니다.

그룹 간격

새 경고 그룹에 대한 첫 번째 알림이 전송되면 Grafana는 그룹 간격 타이머를 시작합니다. Grafana가 그룹 변경 사항에 대한 알림을 보내기 전에 기다리는 시간입니다. 예를 들어, 기존 알림이 해결된 상태에서 그룹에 또 다른 발생 알림이 추가되었을 수 있습니다. 그룹 대기로 인해 알림이 너무 늦어 첫 번째 알림에 포함할 수 없는 경우 그룹 간격 이후 후속 알림에 포함됩니다. 그룹 간격이 경과하면 Grafana는 그룹 간격 타이머를 재설정합니다. 그룹에 알림이 더 이상 없을 때까지 이 과정이 반복되며, 이후에는 그룹이 삭제됩니다.

기본 5분

반복 간격

반복 간격은 그룹이 마지막 알림 이후 변경되지 않은 경우 알림을 반복하는 빈도를 결정합니다. 이는 일부 알림이 계속 발생하고 있음을 알리는 알림이라고 생각할 수 있습니다. 반복 간격은 그룹 간격과 밀접한 관련이 있습니다. 즉, 반복 간격은 그룹 간격보다 크거나 같아야 할 뿐만 아니라 그룹 간격의 배수여야 합니다. 반복 간격이 그룹 간격의 배수가 아닌 경우 하나로 강제 변환됩니다. 예를 들어 그룹 간격이 5분이고 반복 간격이 9분인 경우 반복 간격은 5의 가장 가까운 배수, 즉 10분으로 반올림됩니다.

기본값은 4시간입니다.