Incident Manager でのインシデントへの準備 - Incident Manager

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Incident Manager でのインシデントへの準備

インシデントの計画は、インシデントのライフサイクルのずっと前に始まります。次の図に示すように、インシデントへの対応を開始する前に、チャットチャネルの設定、エスカレーションプランの作成、問い合わせの指定、インシデント対応に使用するオートメーションランブックの決定を行います。次に、モニタリングの方法とレスポンスが自動化されているかどうかを指定するレスポンスプランを使用します。修復が完了したら、インシデントとインシデント対応を分析して、今後のインシデントの対応計画をさらに絞り込むことができます。

インシデントの準備、対応、およびインシデントからの学習のための Incident Manager ワークフロー。

モニタリング

AWS ホストされたアプリケーションの正常性をモニタリングすることは、アプリケーションの稼働時間とパフォーマンスを確保するために重要です。モニタリングソリューションを決定するときは、次の点を考慮してください。

  • 機能の重要度 — システムに障害が発生した場合、ダウンストリームユーザーへの影響はどの程度重要になるか。

  • エラーの共通性 - システムが故障する頻度はどの程度か。頻繁な介入を必要とするシステムは注意深くモニタリングする必要があります。

  • レイテンシーの増加 — タスクを完了するための時間がどれだけ増加または減少したか。

  • クライアント側とサーバー側のメトリクス — クライアントとサーバー上の関連メトリック間に不一致があるか。

  • 依存関係障害 — チームで準備できる、また準備すべき障害。

応答計画を作成した後、モニタリングソリューションを使用して、環境内でインシデントが発生したときにインシデントを自動的に追跡できます。インシデントの追跡と作成の詳細については、「Incident Manager コンソールでのインシデントの詳細の表示」を参照してください。

セキュア、高性能、耐障害性、効率的なインフラストラクチャアプリケーションとワークロードの設計の詳細については、AWS 「 Well-Architected」を参照してください。