Gambaran Umum - Amazon Managed Grafana

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Gambaran Umum

Topik dokumentasi ini dirancang untuk ruang kerja Grafana yang mendukung Grafana versi 10.x.

Untuk ruang kerja Grafana yang mendukung Grafana versi 9.x, lihat. Bekerja di Grafana versi 9

Untuk ruang kerja Grafana yang mendukung Grafana versi 8.x, lihat. Bekerja di Grafana versi 8

Baik Anda baru memulai atau pengguna Grafana Alerting yang lebih berpengalaman, pelajari lebih lanjut tentang dasar-dasar dan fitur yang tersedia yang membantu Anda membuat, mengelola, dan menanggapi peringatan; dan tingkatkan kemampuan tim Anda untuk menyelesaikan masalah dengan cepat.

Prinsip

Dalam sistem peringatan berbasis Prometheus, Anda memiliki generator peringatan yang membuat peringatan dan penerima peringatan yang menerima peringatan. Misalnya, Prometheus adalah generator peringatan dan bertanggung jawab untuk mengevaluasi aturan peringatan, sementara Alertmanager adalah penerima peringatan dan bertanggung jawab untuk mengelompokkan, menghambat, membungkam, dan mengirim pemberitahuan tentang penembakan dan peringatan yang diselesaikan.

Grafana Alerting dibangun di atas model Prometheus dalam merancang sistem peringatan. Ini memiliki generator peringatan internal yang bertanggung jawab untuk menjadwalkan dan mengevaluasi aturan peringatan, serta penerima peringatan internal yang bertanggung jawab untuk mengelompokkan, menghambat, membungkam, dan mengirim pemberitahuan. Grafana tidak menggunakan Prometheus sebagai generator peringatan karena Grafana Alerting perlu bekerja dengan banyak sumber data lain selain Prometheus. Namun, ia menggunakan Alertmanager sebagai penerima peringatan.

Peringatan dikirim ke penerima peringatan di mana mereka diarahkan, dikelompokkan, dihambat, dibungkam, dan diberitahukan. Di Grafana Alerting, penerima peringatan default adalah Alertmanager yang disematkan di dalam Grafana, dan disebut sebagai Grafana Alertmanager. Namun, Anda juga dapat menggunakan Alertmanager lainnya, dan ini disebut sebagai Manajer Peringatan Eksternal.

Dasar-dasar

Berikut ini memberikan ikhtisar tentang berbagai bagian peringatan Grafana.

Aturan peringatan

Aturan peringatan adalah seperangkat kriteria yang menentukan kapan peringatan harus ditembakkan. Ini terdiri dari satu atau lebih pertanyaan dan ekspresi, suatu kondisi yang perlu dipenuhi, interval yang menentukan seberapa sering aturan peringatan dievaluasi, dan durasi di mana kondisi harus dipenuhi agar peringatan menyala.

Aturan peringatan dievaluasi selama intervalnya, dan setiap aturan peringatan dapat memiliki nol, satu, atau sejumlah peringatan yang ditembakkan pada satu waktu. Status aturan peringatan ditentukan oleh yang paling severe waspada, yang dapat berupa salah satu Normal, Tertunda, atau Penembakan. Misalnya, jika setidaknya satu dari peringatan aturan peringatan menyala maka aturan peringatan juga diberlakukan. Kesehatan aturan siaga ditentukan oleh status evaluasi terbarunya. Ini bisa OK, Error, dan NoData.

Fitur yang sangat penting dari aturan peringatan adalah bahwa mereka mendukung anotasi dan label khusus. Ini memungkinkan Anda untuk instrumen peringatan dengan metadata tambahan seperti ringkasan dan deskripsi, dan menambahkan label tambahan untuk merutekan peringatan ke kebijakan pemberitahuan tertentu.

Peringatan

Peringatan diidentifikasi secara unik oleh kumpulan pasangan kunci/nilai yang disebut Label. Setiap kunci adalah nama label dan setiap nilai adalah nilai label. Misalnya, satu peringatan mungkin memiliki label foo=bar dan peringatan lain mungkin memiliki labelfoo=baz. Peringatan dapat memiliki banyak label seperti foo=bar,bar=baz tetapi tidak dapat memiliki label yang sama dua kali sepertifoo=bar,foo=baz. Dua peringatan juga tidak dapat memiliki label yang sama, dan jika dua peringatan memiliki label yang sama seperti foo=bar,bar=baz dan foo=bar,bar=baz kemudian salah satu peringatan akan dibuang. Peringatan diselesaikan ketika kondisi dalam aturan peringatan tidak lagi terpenuhi, atau aturan peringatan dihapus.

Di Grafana Managed Alerts, peringatan bisa dalam status Normal, Tertunda, Peringatan, Tidak Ada Data atau Kesalahan. Di sumber Data Peringatan Terkelola, seperti Mimir dan Loki, peringatan bisa dalam Normal, Tertunda dan Peringatan, tetapi tidak atau Kesalahan. NoData

Titik kontak

Titik kontak menentukan di mana pemberitahuan dikirim. Misalnya, Anda mungkin memiliki titik kontak yang mengirimkan pemberitahuan ke alamat email, ke Slack, ke sistem manajemen insiden (IRM) seperti OnCall Grafana atau Pagerduty, atau ke webhook.

Notifikasi yang dikirim dari titik kontak dapat disesuaikan menggunakan templat notifikasi. Anda dapat menggunakan templat notifikasi untuk mengubah judul, pesan, dan struktur notifikasi. Template notifikasi tidak spesifik untuk integrasi individual atau titik kontak.

Kebijakan pemberitahuan

Kebijakan pemberitahuan mengelompokkan peringatan dan kemudian mengarahkannya ke titik kontak. Mereka menentukan kapan pemberitahuan dikirim, dan seberapa sering pemberitahuan harus diulang.

Peringatan dicocokkan dengan kebijakan notifikasi menggunakan pencocokan label. Ini adalah ekspresi yang dapat dibaca manusia yang menyatakan jika label peringatan sama persis, tidak sama persis, berisi, atau tidak mengandung beberapa teks yang diharapkan. Misalnya, matcher foo=bar mencocokkan peringatan dengan label foo=bar sementara matcher foo=~[a-zA-Z]+ mencocokkan peringatan dengan label apa pun yang disebut foo dengan nilai yang cocok dengan ekspresi reguler. [a-zA-Z]+

Secara default, peringatan hanya dapat mencocokkan satu kebijakan notifikasi. Namun, dengan continue fitur peringatan dapat dibuat untuk mencocokkan sejumlah kebijakan pemberitahuan pada saat yang sama. Untuk informasi selengkapnya tentang kebijakan notifikasi, lihat Kebijakan Pemberitahuan.

Keheningan dan pengaturan waktu bisu

Diam dan pengaturan waktu bisu memungkinkan Anda menjeda notifikasi untuk peringatan tertentu atau bahkan seluruh kebijakan pemberitahuan. Gunakan keheningan untuk menjeda notifikasi secara ad-hoc, seperti saat mengerjakan perbaikan untuk peringatan; dan gunakan pengaturan waktu bisu untuk menjeda notifikasi secara berkala, seperti selama jendela pemeliharaan terjadwal secara rutin.