규칙 파일 생성
Amazon Managed Service for Prometheus에서 규칙을 사용하려면 규칙을 정의하는 규칙 파일을 생성합니다. Amazon Managed Service for Prometheus 규칙 파일은 독립형 Prometheus의 규칙 파일과 형식이 동일한 YAML 텍스트 파일입니다. 자세한 내용은 Prometheus 설명서의 기록 규칙 정의
다음은 규칙 파일의 기본 예제입니다.
groups: - name: cpu_metrics rules: - record: avg_cpu_usage expr: avg(rate(node_cpu_seconds_total[5m])) by (instance) - alert: HighAverageCPU expr: avg_cpu_usage > 0.8 for: 10m keep_firing_for: 20m labels: severity: critical annotations: summary: "Average CPU usage across cluster is too high"
이 간단한 예제에서는 avg_cpu_usage
라는 기록 규칙을 사용하여 새 지표를 생성한 다음 이를 알림에서 사용합니다. 다음 목록에서는 사용된 속성의 일부를 설명합니다. 포함할 수 있는 알림 규칙 및 기타 속성에 대한 자세한 내용은 Prometheus 설명서의 알림 규칙
-
record: avg_cpu_usage
- 이 기록 규칙은avg_cpu_usage
라는 새 지표를 생성합니다. -
expr: avg(rate(node_cpu_seconds_total[5m])) by (instance)
- 기록 규칙에 대한 이 표현식은instance
레이블별로 그룹화하여 각 노드의 지난 5분 동안의 평균 CPU 사용량을 계산합니다. -
alert: HighAverageCPU
- 이 알림 규칙은HighAverageCPU
라는 새 알림을 생성합니다. -
expr: avg_cpu_usage > 0.8
- 이 표현식은 평균 CPU 사용량이 80%를 초과하는 샘플을 찾도록 알림을 표시합니다. -
for: 10m
- 표현식이 10분 동안 충족되면 알림이 실행됩니다. 이 경우 샘플은 평균 5분 이상이므로 임곗값을 초과하는 샘플을 2개 이상 수신하면 알림이 실행됩니다. -
keep_firing_for: 20m
– 이 알림은 샘플이 최소 20분 동안 임곗값 미만이 될 때까지 계속 실행됩니다. 이는 알림이 연속해서 반복적으로 오르내리는 것을 방지하는 데 유용할 수 있습니다.
알림 규칙 예제에 대한 자세한 내용은 알림 규칙 예제
참고
규칙 정의 파일을 로컬에서 생성한 다음 Amazon Managed Service for Prometheus에 업로드하거나 Amazon Managed Service for Prometheus 콘솔 내에서 직접 정의를 생성, 편집 및 업로드할 수 있습니다. 어느 쪽이든 동일한 형식 규칙이 적용됩니다. 파일 업로드 및 편집에 대한 자세한 내용은 Amazon Managed Service for Prometheus에 규칙 구성 파일 업로드 섹션을 참조하세요.