Bekerja dengan rencana respons di Manajer Insiden - Incident Manager

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Bekerja dengan rencana respons di Manajer Insiden

Paket respons memungkinkan Anda merencanakan cara merespons insiden yang berdampak pada pengguna Anda. Rencana respons berfungsi sebagai templat yang mencakup informasi tentang siapa yang harus dilibatkan, tingkat keparahan acara yang diharapkan, runbook otomatis untuk memulai, dan metrik untuk dipantau.

Praktik terbaik

Anda dapat mengurangi dampak pada insiden pada tim Anda ketika Anda merencanakan insiden sebelumnya. Tim harus mempertimbangkan praktik terbaik berikut saat Anda merancang rencana respons.

  • Keterlibatan yang efisien — Identifikasi tim yang paling tepat untuk suatu insiden. Jika Anda melibatkan daftar distribusi yang terlalu luas, atau jika Anda melibatkan tim yang salah, Anda dapat menyebabkan kebingungan dan membuang waktu responden selama insiden.

  • Eskalasi yang andal — Untuk keterlibatan Anda dalam rencana respons, sebaiknya pilih rencana keterlibatan alih-alih kontak atau jadwal panggilan. Rencana keterlibatan harus menentukan kontak individu atau jadwal panggilan (yang berisi beberapa kontak berputar) untuk terlibat selama insiden. Karena responden yang ditentukan dalam rencana keterlibatan Anda kadang-kadang tidak dapat dijangkau, Anda harus mengonfigurasi responden cadangan dalam rencana respons Anda untuk mencakup skenario ini. Dengan kontak cadangan, jika kontak primer dan sekunder tidak tersedia atau ada celah lain yang tidak direncanakan dalam cakupan, Manajer Insiden masih memberi tahu kontak tentang insiden tersebut.

  • Runbook — Gunakan runbook untuk memberikan langkah-langkah yang dapat diulang dan dimengerti yang mengurangi stres yang dialami responden selama insiden.

  • Kolaborasi — Gunakan saluran obrolan untuk merampingkan komunikasi selama insiden. Saluran obrolan membantu responden tetap up to date dengan informasi. Mereka juga dapat berbagi informasi dengan responden lain melalui saluran ini.

Membuat rencana respons

Gunakan prosedur berikut untuk membuat rencana respons dan mengotomatiskan respons insiden.

Untuk membuat rencana respons
  1. Buka konsol Manajer Insiden, dan di panel navigasi, pilih Paket respons.

  2. Pilih Buat rencana respons.

  3. Untuk Nama, masukkan nama paket respons yang unik dan dapat diidentifikasi untuk digunakan di Amazon Resource Name (ARN) untuk paket respons.

  4. (Opsional) Untuk nama Tampilan, masukkan nama yang lebih mudah dibaca manusia untuk membantu mengidentifikasi rencana respons saat Anda membuat insiden.

  5. Lanjutkan dengan menentukan nilai default untuk catatan insiden.

Menentukan nilai default insiden

Untuk membantu Anda mengelola insiden secara lebih efektif, Anda dapat menentukan nilai default. Manajer Insiden menerapkan nilai-nilai ini untuk semua insiden yang terkait dengan rencana respons.

Untuk menentukan nilai default insiden
  1. Untuk Judul, masukkan judul untuk insiden ini untuk membantu Anda mengidentifikasinya di halaman beranda Manajer Insiden.

  2. Untuk Dampak, pilih tingkat dampak untuk menunjukkan potensi ruang lingkup insiden yang dibuat dari rencana respons ini, seperti Kritis atau Rendah. Untuk informasi tentang peringkat dampak di Manajer Insiden, lihatTriase.

  3. (Opsional) Untuk Ringkasan, masukkan ringkasan singkat jenis insiden yang dibuat dari rencana respons ini.

  4. (Opsional) Untuk string Dedupe, masukkan string dedupe. Incident Manager menggunakan string ini untuk mencegah akar penyebab yang sama membuat beberapa insiden di akun yang sama.

    String deduplikasi adalah istilah atau frasa yang digunakan sistem untuk memeriksa insiden duplikat. Jika Anda menentukan string deduplikasi, Manajer Insiden akan mencari insiden terbuka yang berisi string yang sama di dedupeString bidang saat membuat insiden. Jika duplikat terdeteksi, Manajer Insiden menghapus duplikasi insiden yang lebih baru ke dalam insiden yang ada.

    catatan

    Secara default, Manajer Insiden secara otomatis menghapus duplikasi beberapa insiden yang dibuat oleh alarm Amazon CloudWatch atau peristiwa Amazon yang sama. EventBridge Anda tidak perlu memasukkan string deduplikasi Anda sendiri untuk mencegah duplikasi untuk jenis sumber daya ini.

  5. (Opsional) Di bawah Tag Insiden, tambahkan kunci tag dan nilai untuk ditetapkan ke insiden yang dibuat dari rencana respons ini.

    Anda harus memiliki TagResource izin untuk sumber catatan insiden untuk menetapkan tag insiden dalam rencana respons.

  6. Lanjutkan dengan menentukan saluran obrolan opsional untuk penyelesai untuk berkomunikasi satu sama lain tentang insiden.

(Opsional) Menentukan saluran obrolan respons insiden

Saat Anda menyertakan saluran obrolan dalam rencana respons, responden menerima pembaruan insiden melalui saluran tersebut. Mereka dapat berinteraksi dengan insiden langsung dari saluran obrolan dengan menggunakan perintah obrolan.

Dengan menggunakanAWS Chatbot, Anda dapat membuat saluran untuk Slack atau Amazon Chime untuk digunakan dalam paket respons Anda. Untuk informasi tentang membuat saluran obrolanAWS Chatbot, lihat Panduan AWS Chatbot Administrator.

penting

Manajer Insiden harus memiliki izin untuk mempublikasikan ke topik Simple Notification Service Amazon (Amazon SNS) saluran obrolan. Tanpa izin untuk mempublikasikan ke topik SNS itu, Anda tidak dapat menambahkannya ke paket respons. Manajer Insiden menerbitkan pemberitahuan pengujian ke topik SNS untuk memverifikasi izin.

Untuk informasi selengkapnya tentang saluran obrolan, lihatBekerja dengan saluran obrolan di Incident Manager.

Untuk menentukan saluran obrolan respons insiden
  1. Untuk saluran Obrolan, pilih saluran AWS Chatbot obrolan tempat responden dapat berkomunikasi selama insiden terjadi.

    Tip

    Untuk membuat saluran obrolan baruAWS Chatbot, pilih Konfigurasi klien Chatbot baru.

  2. Untuk topik SNS saluran Obrolan, pilih topik SNS tambahan untuk dipublikasikan selama insiden. Menambahkan topik SNS dalam beberapa Wilayah AWS meningkatkan redundansi jika suatu Wilayah turun pada saat insiden.

  3. Lanjutkan dengan memilih kontak, jadwal panggilan, dan rencana eskalasi yang akan dilibatkan selama insiden.

(Opsional) Pilih sumber daya untuk terlibat dalam respons insiden

Penting untuk mengidentifikasi responden yang paling tepat ketika suatu insiden terjadi. Sebagai praktik terbaik, kami menyarankan Anda melakukan hal berikut:

  1. Tambahkan kontak dan jadwal panggilan sebagai saluran eskalasi dalam rencana eskalasi.

  2. Pilih rencana eskalasi sebagai keterlibatan dalam rencana respons.

Untuk informasi selengkapnya tentang kontak dan rencana eskalasi, lihat Bekerja dengan kontak di Insiden Manager danBekerja dengan rencana eskalasi di Incident Manager.

Untuk memilih sumber daya untuk terlibat dalam respons insiden
  1. Untuk Keterlibatan, pilih sejumlah rencana eskalasi, jadwal panggilan, dan kontak individu.

  2. Lanjutkan dengan secara opsional menentukan runbook untuk dijalankan sebagai bagian dari mitigasi insiden Anda.

(Opsional) Menentukan runbook untuk mitigasi insiden

Anda dapat menggunakan runbook dari AWS Systems ManagerAutomation, kemampuanAWS Systems Manager, untuk mengotomatisasi aplikasi umum dan tugas infrastruktur di lingkungan AndaAWS Cloud.

Setiap runbook mendefinisikan alur kerja runbook. Alur kerja buku runbook mencakup tindakan yang dilakukan Systems Manager pada node terkelola atau jenis AWS sumber daya lainnya. Di Manajer Insiden, sebuah runbook mendorong respons insiden dan mitigasi.

Untuk informasi lebih lanjut tentang menggunakan runbook dalam rencana respons,Bekerja dengan runbook Otomasi Manajer Sistem di Manajer Insiden.

Untuk menentukan runbook untuk mitigasi insiden:

  1. Untuk Runbook, lakukan salah satu hal berikut:

    • Pilih Clone runbook dari template untuk membuat salinan runbook Manajer Insiden default. Untuk nama Runbook, masukkan nama deskriptif untuk runbook baru.

    • Pilih Pilih runbook yang ada. Pilih Pemilik, Runbook, dan Versi yang akan digunakan.

      Tip

      Untuk membuat runbook dari awal, pilih Configure new runbook.

      Untuk informasi tentang membuat peran, lihat Bekerja dengan runbook Otomasi Manajer Sistem di Manajer Insiden.

  2. Di area Parameter, berikan parameter apa pun yang diminta untuk runbook yang Anda pilih.

    Parameter yang tersedia adalah yang ditentukan oleh runbook. Satu runbook mungkin memerlukan parameter yang berbeda dari yang lain. Beberapa parameter mungkin diperlukan dan yang lainnya opsional.

    Dalam banyak kasus, Anda dapat memilih untuk memasukkan nilai statis untuk parameter secara manual, seperti daftar ID instans Amazon EC2. Anda juga dapat membiarkan Manajer Insiden memberikan nilai parameter yang dihasilkan secara dinamis oleh insiden.

  3. (Opsional) Untuk AutomationAssumeRole, tentukan peran AWS Identity and Access Management (IAM) yang akan digunakan. Peran ini harus memiliki izin yang diperlukan untuk menjalankan perintah individual yang ditentukan dalam runbook.

    catatan

    Jika tidak AssumeRole ditentukan, Manajer Insiden mencoba menggunakan peran layanan Runbook untuk menjalankan perintah individual yang ditentukan dalam runbook.

    Pilih dari yang berikut ini:

    • Masukkan nilai ARN — Masukkan Nama Sumber Daya Amazon (ARN) secara manual dari AssumeRole, dalam format. arn:aws:iam::account-id:role/assume-role-name Sebagai contoh, arn:aws:iam::123456789012:role/MyAssumeRole.

    • Gunakan peran layanan yang ada — Pilih peran dengan izin yang diperlukan dari daftar peran yang ada di akun Anda.

    • Buat peran layanan baru — Pilih dari antara kebijakan AWS terkelola untuk dilampirkan ke Anda AssumeRole. Setelah memilih opsi ini, untuk kebijakan AWS terkelola, pilih satu atau beberapa kebijakan dari daftar.

      Anda dapat menerima nama default yang disarankan untuk peran baru, atau memasukkan nama yang Anda pilih.

      catatan

      Peran layanan Runbook baru ini dikaitkan dengan runbook tertentu yang Anda pilih. Itu tidak dapat digunakan dengan runbook yang berbeda. Ini karena bagian Sumber Daya kebijakan tidak akan mendukung runbook lain.

  4. Untuk peran layanan Runbook, tentukan peran IAM yang akan digunakan untuk memberikan izin yang diperlukan untuk mengakses dan memulai alur kerja untuk runbook itu sendiri.

    Minimal, peran harus memungkinkan ssm:StartAutomationExecution tindakan untuk runbook spesifik Anda. Agar runbook berfungsi di seluruh akun, peran juga harus mengizinkan sts:AssumeRole tindakan untuk AWS-SystemsManager-AutomationExecutionRole peran yang Anda buat selama Manajemen insiden lintas wilayah dan lintas akun di Manajer Insiden ini.

    Pilih dari yang berikut ini:

    • Buat peran layanan baru — Manajer Insiden membuat peran layanan Runbook untuk Anda yang menyertakan izin minimum yang diperlukan untuk memulai alur kerja buku runbook.

      Untuk nama Peran, Anda dapat menerima nama default yang disarankan, atau memasukkan nama yang Anda pilih. Sebaiknya gunakan nama yang disarankan atau menyimpan nama runbook dalam namanya. Ini karena yang baru AssumeRole dikaitkan dengan runbook tertentu yang Anda pilih dan mungkin tidak menyertakan izin yang diperlukan untuk runbook lain.

    • Gunakan peran layanan yang ada — Peran IAM yang Anda atau Manajer Insiden buat sebelumnya memberikan izin yang diperlukan.

      Untuk nama Peran, pilih nama peran yang ada untuk digunakan.

  5. Perluas Opsi tambahan dan pilih salah satu dari berikut ini untuk menentukan di Akun AWS mana alur kerja runbook harus dijalankan.

    • Akun pemilik paket respons — Mulai alur kerja runbook di Akun AWS yang membuatnya.

    • Akun yang terkena dampak — Mulai alur kerja runbook di akun yang memulai atau melaporkan kejadian tersebut.

      Pilih Akun yang Terdampak saat Anda menggunakan Manajer Insiden untuk skenario lintas akun dan buku runbook perlu mengakses sumber daya di akun yang terkena dampak untuk memulihkannya.

  6. Lanjutkan dengan mengintegrasikan PagerDuty layanan secara opsional ke dalam rencana respons.

(Opsional) Mengintegrasikan PagerDuty layanan ke dalam rencana respons

Untuk mengintegrasikan PagerDuty layanan ke dalam rencana respons

Saat Anda mengintegrasikan Manajer Insiden dengan PagerDuty, PagerDuty buat insiden yang sesuai setiap kali Manajer Insiden membuat insiden. Insiden di PagerDuty menggunakan alur kerja paging dan kebijakan eskalasi yang Anda tetapkan di sana selain yang ada di Manajer Insiden. PagerDuty melampirkan peristiwa timeline dari Manajer Insiden sebagai catatan tentang insiden Anda.

  1. Perluas integrasi pihak ketiga, lalu pilih kotak centang Aktifkan PagerDuty integrasi.

  2. Untuk Select secret, pilih rahasia di AWS Secrets Manager mana Anda menyimpan kredensi untuk mengakses akun Anda PagerDuty .

    Untuk informasi tentang menyimpan PagerDuty kredensil Anda dalam rahasia Secrets Manager, lihat. Menyimpan kredensyal PagerDuty akses secara rahasia AWS Secrets Manager

  3. Untuk PagerDuty layanan, pilih layanan dari PagerDuty akun Anda di mana Anda ingin membuat PagerDuty insiden.

  4. Lanjutkan dengan menambahkan tag opsional dan membuat rencana respons.

Menambahkan tag dan membuat rencana respons

Untuk menambahkan tag dan membuat rencana respons
  1. (Opsional) Di area Tag, terapkan satu atau beberapa pasangan nama/nilai kunci tag ke rencana respons.

    Tag adalah metadata opsional yang Anda tetapkan ke sumber daya. Dengan tag, Anda dapat mengkategorikan sumber daya dengan berbagai cara, seperti berdasarkan tujuan, pemilik, atau lingkungan. Misalnya, Anda mungkin ingin menandai rencana respons untuk mengidentifikasi jenis insiden yang dimaksudkan untuk mitigasi, jenis saluran eskalasi yang dikandungnya, atau rencana eskalasi yang akan dikaitkan dengannya. Untuk informasi selengkapnya tentang menandai sumber daya Manajer Insiden, lihatMenandai sumber daya di Insiden Manager.

  2. Pilih Buat rencana respons.