Membuat aturan peringatan terkelola Grafana - Amazon Managed Grafana

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Membuat aturan peringatan terkelola Grafana

Topik dokumentasi ini dirancang untuk ruang kerja Grafana yang mendukung Grafana versi 9.x.

Untuk ruang kerja Grafana yang mendukung Grafana versi 10.x, lihat. Bekerja di Grafana versi 10

Untuk ruang kerja Grafana yang mendukung Grafana versi 8.x, lihat. Bekerja di Grafana versi 8

Grafana memungkinkan Anda membuat aturan peringatan yang menanyakan satu atau lebih sumber data, mengurangi atau mengubah hasil dan membandingkannya satu sama lain atau dengan ambang batas tetap. Saat ini dijalankan, Grafana mengirimkan notifikasi ke titik kontak.

Untuk menambahkan aturan terkelola Grafana
  1. Dari konsol Grafana Anda, di menu Grafana, pilih ikon Peringatan (bel) untuk membuka halaman Peringatan yang mencantumkan peringatan yang ada.

  2. Pilih Aturan peringatan baru.

  3. Pada Langkah 1, tambahkan nama aturan, jenis dan lokasi penyimpanan, sebagai berikut:

    • Dalam nama Aturan, tambahkan nama deskriptif. Nama ini ditampilkan dalam daftar aturan peringatan. Ini juga merupakan alertname label untuk setiap instance peringatan yang dibuat dari aturan ini.

    • Dari tarik-turun Jenis aturan, pilih Grafana managed alert.

    • Dari dropdown Folder, pilih folder tempat Anda ingin menyimpan aturan. Jika Anda tidak memilih folder, aturan disimpan dalam General folder. Untuk membuat folder, pilih dropdown dan masukkan nama folder baru.

  4. Pada Langkah 2, tambahkan kueri dan ekspresi untuk mengevaluasi.

    • Simpan nama default atau arahkan kursor ke atas dan pilih ikon edit untuk mengubah nama.

    • Untuk kueri, pilih sumber data dari dropdown.

    • Tambahkan satu atau beberapa kueri atau ekspresi.

    • Untuk setiap ekspresi, pilih salah satu kondisi Klasik untuk membuat aturan peringatan tunggal, atau pilih dari opsi Matematika, Kurangi, Sampel ulang untuk menghasilkan peringatan terpisah untuk setiap seri. Untuk detail tentang opsi ini, lihatAturan tunggal dan multidimensi.

    • Pilih Jalankan kueri untuk memverifikasi bahwa kueri berhasil.

  5. Pada Langkah 3, tambahkan kondisi.

    • Dari kondisi tarik-turun, pilih kueri atau ekspresi untuk memulai aturan peringatan.

    • Untuk Evaluasi setiap, tentukan frekuensi evaluasi. Harus kelipatan 10 detik. Misalnya,1m,30s.

    • Untuk Evaluasi untuk, tentukan durasi kondisinya harus benar sebelum peringatan dimulai.

      catatan

      Setelah suatu kondisi dilanggar, peringatan masuk ke Pending status. Jika kondisi tetap dilanggar selama durasi yang ditentukan, peringatan akan beralih ke status. Firing Jika tidak lagi terpenuhi, ia kembali ke Normal negara.

    • Di Konfigurasikan tidak ada data dan penanganan kesalahan, konfigurasikan perilaku peringatan jika tidak ada data. gunakan pedoman di. Tidak menangani data atau kasus kesalahan

    • Pilih Pratinjau lansiran untuk memeriksa hasil menjalankan kueri saat ini. Pratinjau mengecualikan tidak ada data dan kondisi penanganan kesalahan.

  6. Pada Langkah 4, tambahkan metadata tambahan yang terkait dengan aturan.

    • Tambahkan deskripsi dan ringkasan untuk menyesuaikan pesan peringatan. Gunakan pedoman diLabel dan anotasi.

    • Tambahkan URL Runbook, panel, dasbor, dan ID peringatan.

    • Tambahkan label khusus.

  7. Pilih Simpan untuk menyimpan aturan atau Simpan dan keluar untuk menyimpan aturan dan kembali ke halaman Peringatan.

Setelah Anda membuat aturan, Anda dapat membuat pemberitahuan untuk aturan Anda. Untuk informasi selengkapnya tentang notifikasi, lihatMengelola notifikasi peringatan.

Aturan tunggal dan multidimensi

Untuk aturan peringatan terkelola Grafana, Anda dapat membuat aturan dengan kondisi klasik atau Anda dapat membuat aturan multidimensi.

Aturan dimensi tunggal (kondisi klasik)

Gunakan ekspresi kondisi klasik untuk membuat aturan yang memulai peringatan tunggal ketika kondisinya terpenuhi. Untuk kueri yang mengembalikan beberapa seri, Grafana tidak melacak status peringatan setiap seri. Akibatnya, Grafana hanya mengirimkan satu peringatan bahkan ketika kondisi peringatan terpenuhi untuk beberapa seri.

Untuk informasi selengkapnya tentang cara memformat ekspresi, lihat Ekspresi dalam dokumentasi Grafana.

Aturan multidimensi

Untuk menghasilkan instance peringatan terpisah untuk setiap seri yang dikembalikan dalam kueri, buat aturan multidimensi.

catatan

Setiap instance peringatan yang dihasilkan oleh aturan multi-dimensi diperhitungkan dalam total kuota peringatan Anda. Aturan tidak dievaluasi ketika Anda mencapai kuota peringatan Anda. Untuk informasi selengkapnya tentang kuota untuk aturan multi-dimensi, lihat. Kuota mencapai kesalahan

Untuk membuat beberapa instance dari satu aturan, gunakan MathReduce, atau Resample ekspresi untuk membuat aturan multidimensi. Sebagai contoh, Anda dapat:

  • Tambahkan Reduce ekspresi untuk setiap kueri ke nilai agregat dalam rentang waktu yang dipilih menjadi satu nilai. (Tidak diperlukan untuk aturan menggunakan data numerik).

  • Tambahkan Math ekspresi dengan kondisi untuk aturan. Ini tidak diperlukan jika kueri atau ekspresi pengurangan sudah mengembalikan 0 jika aturan tidak harus memulai peringatan, atau angka positif jika harus memulai peringatan.

    Beberapa contoh:

    • $B > 70jika harus memulai peringatan jika nilai kueri/ekspresi B lebih dari 70.

    • $B < $C * 100dalam hal itu harus memulai peringatan jika nilai B kurang dari nilai C dikalikan dengan 100. Jika kueri yang dibandingkan memiliki beberapa seri dalam hasilnya, seri dari kueri yang berbeda dicocokkan jika mereka memiliki label yang sama, atau satu adalah bagian dari yang lain.

catatan

Grafana tidak mendukung kueri peringatan dengan variabel template. Informasi lebih lanjut tersedia di halaman komunitas Variabel Template tidak didukung dalam kueri peringatan saat menyiapkan Peringatan.

Pertimbangan kinerja untuk aturan multidimensi

Setiap instance peringatan dihitung terhadap kuota peringatan. Aturan multidimensi yang membuat lebih banyak instance daripada yang dapat diakomodasi dalam kuota peringatan tidak dievaluasi dan mengembalikan kesalahan kuota. Untuk informasi selengkapnya, lihat Kuota mencapai kesalahan.

Peringatan multidimensi dapat berdampak tinggi pada kinerja ruang kerja Grafana Anda, serta kinerja sumber data Anda saat Grafana menanyakannya untuk mengevaluasi aturan peringatan Anda. Pertimbangan berikut dapat membantu saat Anda mencoba mengoptimalkan kinerja sistem pemantauan Anda.

  • Frekuensi evaluasi aturan — Evaluasi Setiap properti dari aturan peringatan mengontrol frekuensi evaluasi aturan. Kami merekomendasikan menggunakan frekuensi evaluasi terendah yang dapat diterima.

  • Hasil set kardinalitas — Jumlah instance peringatan yang Anda buat dengan aturan memengaruhi kinerjanya. Misalkan Anda memantau kesalahan respons API untuk setiap jalur API, di setiap VM di armada Anda. Set ini memiliki kardinalitas jumlah jalur dikalikan dengan jumlah VM. Anda dapat mengurangi kardinalitas set hasil, misalnya, dengan memantau kesalahan total per VM, bukan per jalur per VM.

  • Kompleksitas kueri — Kueri yang sumber data dapat memproses dan merespons dengan cepat mengkonsumsi lebih sedikit sumber daya. Meskipun pertimbangan ini kurang penting daripada pertimbangan lain yang tercantum di atas, jika Anda telah menguranginya sebanyak mungkin, melihat kinerja kueri individu dapat membuat perbedaan. Anda juga harus menyadari dampak kinerja yang mengevaluasi aturan ini terhadap sumber data Anda. Kueri peringatan seringkali merupakan sebagian besar kueri yang ditangani oleh database pemantauan, jadi faktor beban yang sama yang memengaruhi instance Grafana juga memengaruhi mereka.

Kuota mencapai kesalahan

Ada kuota untuk jumlah instance peringatan yang dapat Anda miliki dalam satu ruang kerja. Ketika Anda mencapai nomor itu, Anda tidak dapat lagi membuat aturan peringatan baru di ruang kerja itu. Dengan peringatan multidimensi, jumlah instance peringatan dapat bervariasi dari waktu ke waktu.

Berikut ini penting untuk diingat saat bekerja dengan instance peringatan.

  • Jika Anda hanya membuat aturan satu dimensi, setiap aturan adalah contoh peringatan tunggal. Anda dapat membuat jumlah aturan yang sama dalam satu ruang kerja dengan kuota instans peringatan, dan tidak lebih.

  • Aturan multidimensi membuat beberapa contoh peringatan, namun jumlahnya tidak diketahui sampai dievaluasi. Misalnya, jika Anda membuat aturan peringatan yang melacak penggunaan CPU instans Amazon EC2 Anda, mungkin ada 50 instans EC2 saat Anda membuatnya (dan karenanya 50 instans peringatan), tetapi jika Anda menambahkan 10 instans EC2 lagi seminggu kemudian, evaluasi berikutnya memiliki 60 instance peringatan.

    Jumlah instans peringatan dievaluasi ketika Anda membuat peringatan multidimensi, dan Anda tidak dapat membuat satu yang segera menempatkan Anda di atas kuota instance peringatan Anda. Karena jumlah instans peringatan dapat berubah, kuota Anda akan diperiksa setiap kali aturan Anda dievaluasi.

  • Pada waktu evaluasi aturan, jika aturan menyebabkan Anda melampaui kuota untuk instans peringatan, aturan tersebut tidak dievaluasi sampai pembaruan dibuat pada aturan peringatan yang membawa jumlah total instance peringatan di bawah kuota layanan. Ketika ini terjadi, Anda menerima pemberitahuan peringatan yang memberi tahu Anda bahwa kuota Anda telah tercapai (notifikasi menggunakan kebijakan notifikasi untuk aturan yang sedang dievaluasi). Pemberitahuan mencakup Error anotasi dengan nilaiQuotaReachedError.

  • Aturan yang menyebabkan QuotaReachedError berhenti dievaluasi. Evaluasi hanya dilanjutkan ketika pembaruan dilakukan dan evaluasi setelah pembaruan tidak sendiri menyebabkan a. QuotaReachedError Aturan yang tidak dievaluasi menunjukkan kesalahan Kuota yang dicapai di konsol Grafana.

  • Anda dapat menurunkan jumlah instance peringatan dengan menghapus aturan peringatan, atau dengan mengedit peringatan multidimensi agar lebih sedikit instance peringatan (misalnya, dengan memiliki satu peringatan tentang kesalahan per VM, daripada satu peringatan tentang kesalahan per API di VM).

  • Untuk melanjutkan evaluasi, perbarui peringatan dan simpan. Anda dapat memperbaruinya untuk menurunkan jumlah instance peringatan, atau jika Anda telah membuat perubahan lain untuk menurunkan jumlah instance peringatan, Anda dapat menyimpannya tanpa perubahan. Jika bisa dilanjutkan, memang begitu. Jika itu menyebabkan yang lainQuotaReachedError, Anda tidak dapat menyimpannya.

  • Ketika peringatan disimpan dan melanjutkan evaluasi tanpa melewati kuota peringatan, kesalahan Kuota tercapai dapat terus ditampilkan di konsol Grafana untuk beberapa waktu (hingga interval evaluasinya), namun, evaluasi aturan peringatan akan dimulai dan peringatan dikirim jika ambang batas aturan terpenuhi.

  • Untuk detail tentang kuota peringatan, serta kuota lainnya, lihat. Kuota layanan Grafana yang Dikelola Amazon

Tidak menangani data atau kasus kesalahan

Pilih opsi untuk cara menangani perilaku peringatan jika tidak ada data atau ketika ada kesalahan.

Opsi untuk menangani tidak ada data tercantum dalam tabel berikut.

Tidak ada opsi Data Perilaku

Tidak ada Data

Buat peringatan DatasourceNoData dengan nama dan UID aturan peringatan, dan UID sumber data yang tidak mengembalikan data sebagai label.

Peringatan

Tetapkan status aturan peringatan keAlerting.

OK

Tetapkan status aturan peringatan keNormal.

Opsi untuk menangani kasus kesalahan tercantum dalam tabel berikut.

Opsi kesalahan atau batas waktu Perilaku

Peringatan

Tetapkan status aturan peringatan ke Alerting

OK

Tetapkan status aturan peringatan ke Normal

Kesalahan

Buat peringatan DatasourceError dengan nama dan UID aturan peringatan, dan UID sumber data yang tidak mengembalikan data sebagai label.