Buat file aturan - Layanan Terkelola Amazon untuk Prometheus

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Buat file aturan

Untuk menggunakan aturan di Amazon Managed Service untuk Prometheus, Anda membuat file aturan yang menentukan aturan. Layanan Terkelola Amazon untuk file aturan Prometheus adalah file teks YAMM yang memiliki format yang sama dengan file aturan di Prometheus mandiri. Untuk informasi selengkapnya, lihat Mendefinisikan aturan Perekaman dan Aturan Peringatan di dokumentasi Prometheus.

Berikut ini adalah contoh dasar dari file aturan:

groups: - name: cpu_metrics rules: - record: avg_cpu_usage expr: avg(rate(node_cpu_seconds_total[5m])) by (instance) - alert: HighAverageCPU expr: avg_cpu_usage > 0.8 for: 10m keep_firing_for: 20m labels: severity: critical annotations: summary: "Average CPU usage across cluster is too high"

Contoh sederhana ini membuat metrik baru menggunakan aturan perekaman, dipanggil avg_cpu_usage dan kemudian menggunakannya dalam peringatan. Berikut ini menjelaskan beberapa properti yang digunakan. Untuk informasi selengkapnya tentang aturan peringatan dan properti lain yang dapat Anda sertakan, lihat Aturan peringatan di dokumentasi Prometheus.

  • record: avg_cpu_usage— Aturan perekaman ini menciptakan metrik baru yang disebutavg_cpu_usage.

  • expr: avg(rate(node_cpu_seconds_total[5m])) by (instance)— Ekspresi untuk aturan perekaman ini menghitung tingkat rata-rata penggunaan CPU selama 5 menit terakhir untuk setiap node, dikelompokkan berdasarkan label. instance

  • alert: HighAverageCPU— Aturan peringatan ini membuat peringatan baru yang disebut HighAverageCPU

  • expr: avg_cpu_usage > 0.8 — Ekspresi ini memberi tahu peringatan untuk mencari sampel di mana penggunaan CPU rata-rata lebih dari 80%.

  • for: 10m— Peringatan akan menyala ketika ekspresi terpenuhi selama 10 menit. Dalam hal ini, sampel rata-rata lebih dari 5 menit, sehingga peringatan akan menyala ketika menerima setidaknya 2 sampel yang melebihi ambang batas.

  • keep_firing_for: 20m— Peringatan ini akan terus menyala sampai sampel berada di bawah ambang batas setidaknya selama 20 menit. Ini dapat berguna untuk menghindari peringatan naik dan turun berulang kali berturut-turut.

Untuk contoh aturan peringatan lainnya, lihat Contoh aturan peringatan.

catatan

Anda dapat membuat file definisi aturan secara lokal lalu mengunggahnya ke Amazon Managed Service for Prometheus, atau Anda dapat membuat, mengedit, dan mengunggah definisi secara langsung di dalam konsol Amazon Managed Service for Prometheus. Either way, aturan pemformatan yang sama berlaku. Untuk mempelajari lebih lanjut tentang mengunggah dan mengedit file Anda, lihatUnggah file konfigurasi aturan ke Amazon Managed Service untuk Prometheus.