Incident Manager でのレスポンスプランの作成と設定 - Incident Manager

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Incident Manager でのレスポンスプランの作成と設定

対応計画を使用して、ユーザーに影響を与えるインシデントへの対応方法を計画します。対応計画はテンプレートとして機能するもので、エンゲージする担当者、イベントの予想される重大度、開始する自動ランブック、モニタリングするメトリクスに関する情報が含まれます。

ベストプラクティス

事前にインシデントの計画を立てておくと、チームへのインシデントの影響を軽減できます。チームは、対応計画を作成する際に以下のベストプラクティスを考慮する必要があります。

  • エンゲージメントの合理化 - インシデントに最も適したチームを特定します。エンゲージの範囲が広すぎたり、間違ったチームにエンゲージさせたりすると、混乱を招き、インシデント発生時に応答者の時間を無駄にする可能性があります。

  • 確実なエスカレーション — 対応計画に取り組む場合は、連絡先やオンコールスケジュールではなく、エンゲージメント計画を選択することをお勧めします。エンゲージメント計画には、インシデント発生時にエンゲージする個々の連絡先またはオンコールスケジュール (複数の交代連絡先を含む) を指定する必要があります。エンゲージメント計画に指定されている応答者に連絡が取れないことがあるため、そのようなシナリオをカバーするために対応計画にバックアップ応答者を設定する必要があります。バックアップの連絡先を指定すると、主要連絡先と副連絡先が不在だったり、カバレッジにその他の予定外のギャップが生じたりした場合でも、Incident Manager はインシデントについて連絡先に通知します。

  • ランブック - 繰り返し可能でわかりやすいステップを提供するランブックを使用して、インシデント中に応答者が経験するストレスを軽減します。

  • コラボレーション - チャットチャネルを使用して、インシデント中のコミュニケーションを合理化します。チャットチャネルは、応答者が最新の情報を維持するのに役立ちます。応答者はこれらのチャネルを通じて他の応答者と情報を共有することもできます。

対応計画の作成

以下の手順に従って対応計画を作成し、インシデント対応を自動化します。

対応計画を作成するには
  1. Incident Manager コンソールを開き、左のナビゲーションペインで、[対応プラン] を選択します。

  2. 対応計画の作成を選択します。

  3. 名前 には、レスポンスプランの Amazon リソースネーム (ARN) で使用する一意で識別可能なレスポンスプラン名を入力します。

  4. (オプション) [表示名] に、インシデントを作成するときに対応計画を識別するのに役立つ、わかりやすい名前を入力します。

  5. 続けて、インシデントレコードのデフォルト値を指定します。

インシデントデフォルト値の指定

インシデントをより効果的に管理するために、デフォルト値を指定できます。Incident Manager は、これらの値を対応計画に関連するすべてのインシデントに適用します。

インシデントのデフォルト値を指定するには
  1. [タイトル] に、Incident Manager のホームページで識別するのに役立つように、このインシデントのタイトルを入力します。

  2. [影響] では、この対応計画から作成されるインシデントの潜在的な範囲を示す影響レベル ([重大][低] など) を選択します。Incident Manager での影響評価の詳細については、「トリアージ」を参照してください。

  3. (オプション) [概要] に、この対応計画から作成されたインシデントのタイプの簡潔な概要を入力します。

  4. (オプション) [重複排除文字列] は、重複排除文字列を入力します。Incident Manager は、この文字列を使用して、同じ根本原因が同じアカウントに複数のインシデントを作成しないようにします。

    重複排除文字列は、システムがインシデントの重複をチェックするために使用する用語またはフレーズです。重複排除文字列を指定すると、Incident Manager はインシデントを作成するときに dedupeString フィールドに同じ文字列が含まれる未解決のインシデントを検索します。重複が検出されると、Incident Manager は新しいインシデントを既存のインシデントに重複排除します。

    注記

    デフォルトでは、Incident Manager は、同じ Amazon CloudWatch アラームまたは Amazon EventBridge イベントによって作成された複数のインシデントを自動的に重複排除します。これらのリソースタイプの重複を避けるために、独自の重複排除文字列を入力する必要はありません。

  5. (オプション) [インシデントタグ] の下に、この対応計画から作成されたインシデントに割り当てるタグキーと値を追加します。

    対応計画内にインシデントタグを設定するには、インシデントレコードリソースに対する TagResource アクセス許可が必要です。

  6. 続いて、解決者どうしがインシデントについてやり取りするためのオプションのチャットチャネルを指定します。

(オプション) インシデント対応チャットチャネルの指定

対応計画にチャットチャネルを含めると、応答者はこのチャネルを通じてインシデントの最新情報を受け取ります。応答者は、チャットコマンドを使用して、チャットチャネルから直接インシデントを操作できます。

を使用して AWS Chatbot、 のチャネルを作成できます。Slack、 用 Microsoft Teams、または Amazon Chime がレスポンスプランで使用する。でチャットチャネルを作成する方法については AWS Chatbot、AWS Chatbot 「 管理者ガイド」を参照してください。

重要

Incident Manager には、チャットチャネルの Amazon Simple Notification Service (Amazon SNS) トピックに発行するアクセス許可が必要です。そのSNSトピックに発行するアクセス許可がない場合、レスポンスプランに追加することはできません。Incident Manager は、 SNSトピックにテスト通知を発行して、アクセス許可を確認します。

チャットチャネルの詳細については、「Incident Manager でのレスポンダーのチャットチャネルの作成と統合」を参照してください。

インシデント対応チャットチャネルを指定するには
  1. チャットチャネル では、インシデント中にレスポンダーが通信できる AWS Chatbot チャットチャネルを選択します。

    ヒント

    で新しいチャットチャネルを作成するには AWS Chatbot、「新しい Chatbot クライアントを設定する」を選択します。

  2. Chat チャンネルSNSトピック では、インシデント中に公開する追加のSNSトピックを選択します。複数の にSNSトピックを追加すると、インシデント時にリージョンがダウンした場合に冗長性 AWS リージョン が向上します。

  3. 続いて、インシデント発生時にエンゲージする連絡先、オンコールスケジュール、エスカレーション計画を選択します。

(オプション) インシデント対応にエンゲージするリソースの選択

インシデントが発生したときに、最も適切な応答者を特定することが重要です。ベストプラクティスとして、以下を実行することをお勧めします。

  1. エスカレーション計画のエスカレーションチャネルとして、連絡先とオンコールスケジュールを追加します。

  2. 対応計画のエンゲージメントとして、エスカレーション計画を選択します。

連絡先とエスカレーション計画の詳細については、「Incident Manager での問い合わせの作成と設定」と「Incident Manager でのレスポンダーエンゲージメントのエスカレーションプランの作成」を参照してください。

インシデント対応にエンゲージするリソースを選択するには
  1. [エンゲージメント] では、エスカレーション計画、オンコールスケジュール、個別の連絡先をいくつでも選択できます。

  2. 続いて、オプションで、インシデント軽減の一環として実行するランブックを指定します。

(オプション) インシデント軽減のためのランブックの指定

の一機能である AWS Systems Manager Automation のランブックを使用して AWS Systems Manager、 AWS クラウド 環境内の一般的なアプリケーションおよびインフラストラクチャタスクを自動化できます。

各ランブックでは、ランブックワークフローを定義します。ランブックワークフローには、Systems Manager がマネージドノードまたはその他の AWS リソースタイプに対して実行するアクションが含まれます。Incident Manager では、ランブックはインシデント対応とインシデントの軽減に役立ちます。

対応計画でのランブックの使用の詳細については、「インシデント修復のための Incident Manager での Systems Manager Automation ランブックの統合」を参照してください。

インシデント軽減のためのランブックを指定するには:

  1. [ランブック] で、以下のいずれかを実行します。

    • [テンプレートからランブックを複製] を選択し、デフォルトの Incident Manager ランブックのコピーを作成します。[名前] に、新しいランブックのわかりやすい名前を入力します。

    • [既存のランブックを選択] を選択します。[所有者][ランブック]、使用する [バージョン] を選択します。

      ヒント

      ランブックを一から作成するには、[新しいランブックを設定] を選択します。

      ランブックの作成の詳細については、「インシデント修復のための Incident Manager での Systems Manager Automation ランブックの統合」を参照してください。

  2. [パラメータ] 領域で、選択したランブックに必要なパラメータを指定します。

    使用可能なパラメータは、ランブックに指定されているパラメータです。ランブックに応じて、別のランブックとは異なるパラメータが必要になることがあります。パラメータには必須のものとオプションのものがあります。

    多くの場合、Amazon EC2インスタンス のリストなど、パラメータの静的な値を手動で入力することを選択できますIDs。インシデントによって動的に生成されたパラメータ値を Incident Manager に入力させることもできます。

  3. (オプション) にはAutomationAssumeRole、使用する AWS Identity and Access Management (IAM) ロールを指定します。このロールには、ランブック内に指定されている個々のコマンドの実行に必要なアクセス許可が必要です。

    注記

    AssumeRole が指定されていない場合、Incident Manager はランブックサービスロールを使用して、ランブック内で指定されている個々のコマンドを実行しようとします。

    次から選択します。

    • ARN 値の入力 – の Amazon リソースネーム (ARN) を AssumeRole形式で手動で入力しますarn:aws:iam::account-id:role/assume-role-name。例えば、arn:aws:iam::123456789012:role/MyAssumeRole と指定します。

    • [既存のサービスロールを使用] — アカウント内の既存のロールのリストから、必要なアクセス許可を持つロールを選択します。

    • 新しいサービスロールの作成 – にアタッチする AWS 管理ポリシーの中から選択します AssumeRole。このオプションを選択した後、[AWS マネージドポリシー] で、リストから 1 つ以上のポリシーを選択します。

      新しいロールに提示されたデフォルト名を使用することも、選択した名前を入力することもできます。

      注記

      この新しいランブックサービスロールは、選択した特定のランブックに関連付けられます。別のランブックでは使用できません。これは、ポリシーのランブックセクションが他のランブックをサポートしないためです。

  4. Runbook サービスロール では、ランブック自体のワークフローにアクセスして開始するために必要なアクセス許可を提供するために使用するIAMロールを指定します。

    少なくとも、このロールは、特定のランブックの ssm:StartAutomationExecution アクションを許可する必要があります。ランブックがアカウント間で動作するためには、Incident Manager での AWS アカウント および リージョン間のインシデントの管理 中に作成した AWS-SystemsManager-AutomationExecutionRole ロールに対する sts:AssumeRole アクションも許可する必要があります。

    次から選択します。

    • [新しいサービスロールを作成] — Incident Manager は、ランブックワークフローを開始するために最低限必要なアクセス許可を含むランブックサービスロールを自動的に作成します。

      [ロール名] には、提示されたデフォルト名を使用することも、選択した名前を入力することもできます。この名前には、提示された名前を使用するか、ランブックの名前を残しておくことをお勧めします。これは、新しい AssumeRole が選択した特定のランブックに関連付けられており、他のランブックに必要なアクセス許可が含まれていない可能性があるためです。

    • 既存のサービスロールを使用する – 以前に作成したIAMロールによって、必要なアクセス許可が付与されます。

      [ロール名] で、使用する既存のロールの名前を選択します。

  5. 追加オプションを展開し、次のいずれかを選択して、ランブックワークフローを実行する AWS アカウント 場所を指定します。

    • レスポンスプラン所有者のアカウント — ランブックワークフローを AWS アカウント 作成した で開始します。

    • [影響を受けたアカウント] — インシデントを開始または報告したアカウントでランブックワークフローを開始します。

      [影響を受けたアカウント] は、Incident Manager をクロスアカウントシナリオで使用していて、ランブックが影響を受けたアカウントのリソースにアクセスしてそれらを修正する必要がある場合に選択します。

  6. オプションで PagerDuty サービスをレスポンスプラン に統合して続行します

(オプション) PagerDuty サービスをレスポンスプランに統合する

PagerDuty サービスをレスポンスプランに統合するには

Incident Manager を と統合すると PagerDuty、Incident Manager がインシデント PagerDuty を作成するたびに、 が対応するインシデントを作成します。のインシデントは、Incident Manager のページングワークフローとエスカレーションポリシーに加えて、そこで定義したページングワークフローとエスカレーションポリシー PagerDuty を使用します。 は、インシデントに関するメモとして Incident Manager からのタイムラインイベントを PagerDuty アタッチします。

  1. サードパーティー統合 を展開し、 PagerDuty 統合を有効にする チェックボックスを選択します。

  2. シークレットを選択 では、 PagerDuty アカウントにアクセスするための認証情報を保存する の AWS Secrets Manager シークレットを選択します。

    Secrets Manager シークレットに PagerDuty 認証情報を保存する方法については、「」を参照してください PagerDuty アクセス認証情報を AWS Secrets Manager シークレットに保存する

  3. PagerDuty サービス の場合、 PagerDuty インシデントを作成する PagerDuty アカウントからサービスを選択します。

  4. 続いて、オプションでタグを追加して対応計画を作成します。

タグを追加して対応計画を作成する

タグを追加して対応計画を作成するには
  1. (オプション) [タグ] 領域で、1 つ以上のタグキーの名前と値のペアを対応計画に適用します。

    タグは、リソースに割り当てるオプションのメタデータです。タグを使用して、目的、所有者、環境などのさまざまな方法でリソースを分類できます。例えば、軽減対象となるインシデントの種類、含まれるエスカレーションチャネルの種類、関連するエスカレーション計画を識別するために、対応計画にタグを付けることができます。Incident Manager リソースへのタグ付けの詳細については、「Incident Manager でのリソースのタグ付け」を参照してください。

  2. 対応計画の作成を選択します。