REL06-BP03 Kirim pemberitahuan (Pemrosesan waktu nyata dan mengkhawatirkan) - Pilar Keandalan

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

REL06-BP03 Kirim pemberitahuan (Pemrosesan waktu nyata dan mengkhawatirkan)

Ketika organisasi mendeteksi potensi masalah, mereka mengirimkan notifikasi dan peringatan waktu nyata kepada personel dan sistem yang sesuai untuk merespons masalah ini dengan cepat dan efektif.

Hasil yang diinginkan: Respons yang cepat terhadap peristiwa operasional dapat terjadi melalui konfigurasi alarm yang relevan berdasarkan metrik layanan dan aplikasi. Ketika ambang batas alarm dilanggar, personel dan sistem yang sesuai mendapatkan notifikasi sehingga mereka dapat mengatasi masalah-masalah yang mendasarinya.

Anti-pola umum:

  • Mengonfigurasi alarm dengan ambang batas yang terlalu tinggi, akan mengakibatkan kegagalan untuk mengirim notifikasi-notifikasi penting.

  • Mengonfigurasi alarm dengan ambang batas yang terlalu rendah, akan menyebabkan tidak adanya tindakan atas notifikasi-notifikasi penting karena kebisingan notifikasi yang berlebihan.

  • Tidak memperbarui alarm dan ambang batasnya saat penggunaan berubah.

  • Untuk alarm yang paling sesuai untuk ditangani melalui tindakan otomatis, mengirim notifikasi ke personel alih-alih membuat tindakan otomatis, akan menyebabkan terjadinya pengiriman notifikasi yang berlebihan.

Manfaat menerapkan praktik terbaik ini: Mengirimkan notifikasi dan pemberitahuan waktu nyata kepada personel dan sistem yang sesuai akan memungkinkan dilakukannya deteksi dini terhadap masalah dan memungkinkan respons yang cepat terhadap insiden operasional.

Tingkat risiko yang terjadi jika praktik terbaik ini tidak diterapkan: Tinggi

Panduan implementasi

Beban kerja harus dilengkapi dengan pemrosesan dan peringatan alarm waktu nyata untuk meningkatkan pendeteksian masalah yang dapat memengaruhi ketersediaan aplikasi dan berfungsi sebagai pemicu respons otomatis. Organisasi dapat melakukan pemrosesan dan peringatan alarm waktu nyata dengan menciptakan peringatan dengan metrik yang ditentukan untuk menerima notifikasi setiap kali peristiwa signifikan terjadi atau sebuah metrik melebihi ambang batas.

Amazon CloudWatch memungkinkan Anda membuat alarm metrik dan komposit menggunakan CloudWatch alarm berdasarkan ambang batas statis, deteksi anomali, dan kriteria lainnya. Untuk detail selengkapnya tentang jenis alarm yang dapat Anda konfigurasikan CloudWatch, lihat bagian alarm pada CloudWatch dokumentasi.

Anda dapat membuat tampilan metrik dan peringatan yang disesuaikan dari AWS sumber daya Anda untuk tim Anda menggunakan dasbor. CloudWatch Halaman beranda yang dapat disesuaikan di CloudWatch konsol memungkinkan Anda memantau sumber daya dalam satu tampilan di beberapa Wilayah.

Alarm dapat melakukan satu atau beberapa tindakan, seperti mengirim notifikasi ke SNStopik Amazon, melakukan tindakan Amazon, atau EC2 tindakan Penskalaan EC2Otomatis Amazon, atau membuat OpsItem insiden atau masuk. AWS Systems Manager

Amazon CloudWatch menggunakan Amazon SNS untuk mengirim pemberitahuan ketika alarm berubah status, memberikan pengiriman pesan dari penerbit (produsen) ke pelanggan (konsumen). Untuk detail selengkapnya tentang mengatur SNS notifikasi Amazon, lihat Mengonfigurasi Amazon SNS.

CloudWatch mengirimkan EventBridgeperistiwa setiap kali CloudWatch alarm dibuat, diperbarui, dihapus, atau statusnya berubah. Anda dapat menggunakan EventBridge dengan peristiwa ini untuk membuat aturan yang melakukan tindakan, seperti memberi tahu Anda setiap kali status alarm berubah atau secara otomatis memicu peristiwa di akun Anda menggunakan otomatisasi Systems Manager.

Kapan sebaiknya Anda menggunakan EventBridge atau AmazonSNS?

Keduanya EventBridge dan Amazon SNS dapat digunakan untuk mengembangkan aplikasi berbasis peristiwa, dan pilihan Anda akan tergantung pada kebutuhan spesifik Anda.

Amazon EventBridge direkomendasikan saat Anda ingin membuat aplikasi yang bereaksi terhadap peristiwa dari aplikasi, aplikasi SaaS, dan layanan Anda sendiri. AWS EventBridge adalah satu-satunya layanan berbasis acara yang terintegrasi langsung dengan mitra SaaS pihak ketiga. EventBridge juga secara otomatis menyerap peristiwa dari lebih dari 200 AWS layanan tanpa mengharuskan pengembang untuk membuat sumber daya apa pun di akun mereka.

EventBridge menggunakan struktur JSON berbasis yang ditentukan untuk acara, dan membantu Anda membuat aturan yang diterapkan di seluruh badan acara untuk memilih acara untuk diteruskan ke target. EventBridge Saat ini mendukung lebih dari 20 AWS layanan sebagai target, termasuk AWS Lambda, Amazon SQS, AmazonSNS, Amazon Kinesis Data Streams, dan Amazon Data Firehose.

Amazon SNS direkomendasikan untuk aplikasi yang membutuhkan fan out tinggi (ribuan atau jutaan titik akhir). Pola umum yang kami lihat adalah bahwa pelanggan menggunakan Amazon SNS sebagai target aturan mereka untuk memfilter peristiwa yang mereka butuhkan, dan menyebar ke beberapa titik akhir.

Pesan tidak terstruktur dan dapat dalam format apa pun. Amazon SNS mendukung penerusan pesan ke enam jenis target yang berbeda, termasuk Lambda, SQS Amazon, /S endpointHTTP,, push selulerSMS, dan email. Latensi SNS khas Amazon di bawah 30 milidetik. Berbagai AWS layanan mengirim SNS pesan Amazon dengan mengonfigurasi layanan untuk melakukannya (lebih dari 30, termasuk Amazon, Amazon S3EC2, dan Amazon RDS).

Langkah-langkah implementasi

  1. Buat alarm menggunakan CloudWatch alarm Amazon.

    1. Alarm metrik memonitor CloudWatch metrik tunggal atau ekspresi yang bergantung pada CloudWatch metrik. Alarm memulai satu atau beberapa tindakan berdasarkan nilai metrik atau ekspresi dibandingkan dengan ambang batas selama interval waktu tertentu. Tindakan dapat terdiri dari mengirim pemberitahuan ke SNStopik Amazon, melakukan tindakan Amazon atau EC2 tindakan EC2Auto Scaling Amazon, atau membuat OpsItem atau insiden di. AWS Systems Manager

    2. Sebuah alarm gabungan terdiri dari ekspresi aturan yang mempertimbangkan kondisi alarm dari alarm-alarm lain yang telah Anda buat. Alarm gabungan hanya memasuki status alarm jika semua kondisi aturan terpenuhi. Alarm yang ditentukan dalam ekspresi aturan suatu alarm komposit dapat mencakup alarm-alarm metrik dan alarm gabungan tambahan. Alarm komposit dapat mengirim SNS pemberitahuan Amazon ketika statusnya berubah dan dapat membuat Systems Manager OpsItemsatau insiden saat memasuki status alarm, tetapi mereka tidak dapat melakukan tindakan Amazon EC2 atau Auto Scaling.

  2. Siapkan SNSnotifikasi Amazon. Saat membuat CloudWatch alarm, Anda dapat menyertakan SNS topik Amazon untuk mengirim pemberitahuan saat alarm berubah status.

  3. Buat aturan EventBridge yang cocok dengan CloudWatch alarm yang ditentukan. Setiap aturan mendukung beberapa target, termasuk fungsi Lambda. Misalnya, Anda dapat menentukan alarm yang dimulai saat ruang disk yang tersedia hampir habis, yang memicu fungsi Lambda melalui EventBridge aturan, untuk membersihkan ruang. Untuk detail lebih lanjut tentang EventBridge target, lihat EventBridge target.

Sumber daya

Praktik terbaik Well-Architected terkait:

Dokumen terkait:

Video terkait:

Contoh terkait: