Apa Itu AWS Systems Manager Incident Manager? - Incident Manager

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Apa Itu AWS Systems Manager Incident Manager?

Incident Manager, kemampuanAWS Systems Manager, dirancang untuk membantu Anda mengurangi dan memulihkan dari insiden yang memengaruhi aplikasi Anda yang di-host. AWS

Dalam konteksAWS, insiden adalah gangguan yang tidak direncanakan atau penurunan kualitas layanan yang dapat berdampak signifikan pada operasi bisnis. Oleh karena itu, sangat penting bagi organisasi untuk menetapkan strategi respons untuk mengurangi dan memulihkan secara efisien dari insiden, dan menerapkan tindakan untuk mencegah insiden di masa depan.

Manajer Insiden membantu mengurangi waktu untuk menyelesaikan insiden dengan:

  • Menyediakan rencana otomatis untuk melibatkan orang-orang yang bertanggung jawab untuk menanggapi insiden secara efisien.

  • Menyediakan data pemecahan masalah yang relevan.

  • Mengaktifkan tindakan respons otomatis dengan menggunakan runbook Otomasi yang telah ditentukan sebelumnya.

  • Menyediakan metode untuk berkolaborasi dan berkomunikasi dengan semua pemangku kepentingan.

Fitur dan alur kerja yang dibangun ke dalam Manajer Insiden didasarkan pada praktik terbaik untuk respons insiden yang telah dikembangkan Amazon hampir sejak awal. Incident Manager terintegrasi dengan Layanan AWS seperti Amazon CloudWatch,, AWS CloudTrailAWS Systems Manager, dan Amazon EventBridge.

Komponen dan fitur utama

Bagian ini menjelaskan fitur di Manajer Insiden yang Anda gunakan untuk menyiapkan rencana respons insiden.

Rencana respons

Rencana respons berfungsi sebagai templat yang mendefinisikan apa yang harus ada saat insiden terjadi. Ini termasuk informasi seperti:

  • Siapa yang diminta untuk merespons ketika suatu insiden terjadi.

  • Respon otomatis yang mapan untuk mengurangi insiden tersebut.

  • Alat kolaborasi yang harus digunakan responden untuk berkomunikasi dan menerima pemberitahuan otomatis tentang insiden tersebut.

Deteksi insiden

Anda dapat mengonfigurasi CloudWatch alarm Amazon dan EventBridge peristiwa Amazon untuk membuat insiden saat kondisi atau perubahan yang memengaruhi AWS sumber daya Anda terdeteksi.

Dukungan otomatisasi Runbook

Anda dapat memulai runbook Otomasi dari dalam Manajer Insiden untuk mengotomatiskan respons kritis Anda terhadap insiden dan memberikan langkah-langkah terperinci kepada responden pertama.

Keterlibatan dan eskalasi

Rencana keterlibatan menentukan setiap orang untuk memberi tahu setiap insiden unik. Anda dapat menentukan kontak individual yang telah ditambahkan ke Manajer Insiden atau menentukan jadwal panggilan yang Anda buat di Manajer Insiden. Rencana keterlibatan juga menentukan jalur eskalasi untuk membantu memastikan visibilitas di antara para pemangku kepentingan dan partisipasi aktif selama proses respons insiden.

Jadwal panggilan

Jadwal panggilan di Manajer Insiden terdiri dari satu atau lebih rotasi yang Anda buat untuk jadwal tersebut. Untuk setiap rotasi, Anda dapat menyertakan hingga 30 kontak. Ketika ditambahkan ke rencana eskalasi atau rencana respons, jadwal panggilan menentukan siapa yang diberitahu ketika insiden terjadi yang memerlukan intervensi responden. Jadwal panggilan membantu memastikan bahwa Anda memiliki cakupan penuh, berlebihan, 24/7 sesuai kebutuhan untuk respons insiden Anda.

Kolaborasi aktif

Responden insiden secara aktif menanggapi insiden melalui integrasi dengan klien. AWS Chatbot AWS Chatbotmendukung pembuatan saluran obrolan untuk Manajer Insiden yang menggunakan SlackMicrosoft Teams,, atau Amazon Chime. Responden dapat berkomunikasi langsung satu sama lain, menerima pemberitahuan otomatis tentang insiden, dan—dalam Slack dan Microsoft Teams —langsung menjalankan beberapa operasi antarmuka baris perintah Manajer Incident (CLI).

Diagnosis insiden

Responden dapat melihat up-to-date informasi di konsol Manajer Insiden selama insiden terjadi. Berdasarkan perubahan informasi, responden kemudian dapat membuat item tindak lanjut dan memperbaikinya dengan menggunakan runbook Otomasi.

Temuan dari layanan lain

Untuk mendukung diagnosis insiden responden, Anda dapat mengaktifkan fitur Temuan di Manajer Insiden. Temuan adalah informasi tentang AWS CodeDeploy penyebaran dan pembaruan AWS CloudFormation tumpukan yang terjadi sekitar waktu insiden, dan yang melibatkan satu atau lebih sumber daya yang kemungkinan terkait dengan insiden tersebut. Memiliki informasi ini mengurangi waktu yang dibutuhkan untuk mengevaluasi penyebab potensial, yang dapat mengurangi mean time to recover (MTTR) dari suatu insiden.

Analisis pasca-insiden

Setelah insiden diselesaikan, Anda menggunakan analisis pasca-insiden untuk mengidentifikasi peningkatan respons insiden Anda, termasuk waktu untuk deteksi dan mitigasi. Analisis juga dapat membantu Anda memahami akar penyebab insiden tersebut. Manajer Insiden membuat item tindakan tindak lanjut yang direkomendasikan yang dapat Anda gunakan untuk meningkatkan respons insiden Anda.

Manfaat menggunakan Manajer Insiden

Pelajari tentang manfaat menggunakan Manajer Insiden dalam operasi deteksi dan respons insiden Anda.

Bagian ini menjelaskan keuntungan yang dapat diperoleh organisasi Anda saat Anda menerapkan rencana respons Manajer Insiden.

Mendiagnosis masalah secara efisien dan segera

CloudWatch Alarm Amazon dan EventBridge peristiwa Amazon yang Anda konfigurasikan dapat membuat insiden secara otomatis ketika ada gangguan yang tidak direncanakan atau pengurangan kualitas layanan Anda.

CloudWatch alarm mendeteksi dan melaporkan ketika ada perubahan pada nilai metrik atau ekspresi yang relatif terhadap ambang batas selama beberapa periode waktu. EventBridge peristiwa dibuat sebagai hasil dari perubahan lingkungan, aplikasi, atau layanan yang telah Anda tentukan dalam EventBridge aturan. Saat Anda membuat alarm atau acara, Anda dapat menentukan tindakan untuk insiden yang akan dibuat di Manajer Insiden dan rencana respons yang sesuai untuk memfasilitasi keterlibatan, eskalasi, dan mitigasi insiden tersebut.

Manajer Insiden menyediakan kemampuan untuk secara otomatis mengumpulkan dan melacak metrik yang terkait dengan suatu insiden, melalui penggunaan CloudWatch metrik. Selain metrik otomatis yang dihasilkan untuk insiden saat dibuat melalui CloudWatch alarm, Anda dapat menambahkan metrik secara manual secara real time, untuk memberikan konteks dan data tambahan kepada responden dalam suatu insiden.

Gunakan timeline insiden Manajer Insiden untuk menampilkan tempat menarik dalam urutan kronologis. Responden juga dapat menggunakan timeline untuk menambahkan peristiwa khusus untuk menggambarkan apa yang mereka lakukan atau apa yang terjadi. Tempat menarik otomatis meliputi:

  • CloudWatch Alarm atau EventBridge aturan menciptakan insiden.

  • Metrik insiden dilaporkan ke Manajer Insiden.

  • Responden terlibat.

  • Langkah-langkah buku runbook berhasil diselesaikan.

Terlibat secara efektif

Manajer Insiden menyatukan responden insiden melalui penggunaan kontak, jadwal panggilan, rencana eskalasi, dan saluran obrolan. Anda menentukan kontak individu secara langsung di Manajer Insiden dan menentukan preferensi kontak (email, SMS, atau suara). Anda menambahkan kontak ke rotasi jadwal panggilan untuk menentukan siapa yang terlibat untuk menangani insiden selama periode tertentu. Dengan menggunakan kontak dan jadwal panggilan yang ditentukan, Anda membuat rencana eskalasi untuk melibatkan responden yang diperlukan pada waktu yang tepat selama insiden.

Berkolaborasi secara real time

Komunikasi selama insiden adalah kunci untuk resolusi yang lebih cepat. Menggunakan AWS Chatbot klien yang disiapkan untuk menggunakanSlack,Microsoft Teams, atau Amazon Chime, Anda dapat mengumpulkan responden di saluran obrolan terkoneksi pilihan mereka di mana mereka berinteraksi langsung dengan insiden dan satu sama lain. Manajer Insiden juga menampilkan tindakan real-time dari responden insiden di saluran obrolan, memberikan konteks kepada orang lain.

Mengotomatiskan restorasi layanan

Manajer Insiden memungkinkan responden Anda untuk fokus pada tugas-tugas utama yang diperlukan untuk menyelesaikan insiden melalui penggunaan runbook Otomasi. Di Manajer Insiden, runbook adalah serangkaian tindakan yang telah ditentukan sebelumnya yang diambil untuk menyelesaikan suatu insiden. Mereka menggabungkan kekuatan tugas otomatis dengan langkah-langkah manual sesuai kebutuhan, membuat responden lebih tersedia untuk menganalisis dan menanggapi dampak.

Mencegah insiden future

Dengan menggunakan analisis pasca insiden Manajer Insiden, tim Anda dapat mengembangkan rencana respons yang lebih kuat dan perubahan efek di seluruh aplikasi Anda untuk mencegah insiden dan waktu henti di masa depan. Analisis pasca-insiden juga menyediakan pembelajaran berulang dan peningkatan runbook, rencana respons, dan metrik.

Incident Manager terintegrasi dengan beberapa layanan Layanan AWS dan alat pihak ketiga lainnya untuk membantu Anda mendeteksi dan menyelesaikan insiden, dan berinteraksi dengan operasi API-nya secara tidak langsung dan mengelola infrastruktur. Untuk informasi, lihat Integrasi produk dan layanan dengan Manajer Insiden.

Mengakses Manajer Insiden

Anda dapat mengakses Manajer Insiden dengan salah satu cara berikut:

Wilayah Manajer Insiden dan kuota

Incident Manager tidak didukung di semua yang Wilayah AWS didukung oleh Systems Manager.

Untuk melihat informasi tentang Wilayah Manajer Insiden dan kuota, lihat AWS Systems Manager Incident Managertitik akhir dan kuota di. Referensi Umum Amazon Web

Harga untuk Manajer Insiden

Ada biaya untuk menggunakan Manajer Insiden. Untuk informasi selengkapnya, lihat harga AWS Systems Manager.

catatan

Konten lainLayanan AWS, AWS konten, dan konten pihak ketiga yang tersedia sehubungan dengan layanan ini dapat dikenakan biaya terpisah dan diatur oleh ketentuan tambahan.

Untuk gambaran umumTrusted Advisor, layanan yang membantu Anda mengoptimalkan biaya, keamanan, dan kinerja AWS lingkungan Anda, lihat AWS Trusted Advisordi Panduan AWS Support Pengguna.