翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Incident Manager でのインシデントへの準備
インシデントの計画は、インシデントのライフサイクルのずっと前に始まります。次の図に示すように、インシデントへの対応を開始する前に、チャットチャネルの設定、エスカレーションプランの作成、問い合わせの指定、インシデント対応に使用するオートメーションランブックの決定を行います。次に、モニタリングの方法とレスポンスが自動化されているかどうかを指定するレスポンスプランを使用します。修復が完了したら、インシデントとインシデント対応を分析して、今後のインシデントの対応計画をさらに絞り込むことができます。
トピック
- モニタリング
- Incident Manager でのレプリケーションセットと結果の設定
- Incident Manager での問い合わせの作成と設定
- Incident Manager でのオンコールスケジュールによるレスポンダーローテーションの管理
- Incident Manager でのレスポンダーエンゲージメントのエスカレーションプランの作成
- Incident Manager でのレスポンダーのチャットチャネルの作成と統合
- インシデント修復のための Incident Manager での Systems Manager Automation ランブックの統合
- Incident Manager でのレスポンスプランの作成と設定
- Incident Manager で、他のサービスからのインシデントの潜在的な原因を「検出」として特定する
モニタリング
AWS ホストされたアプリケーションの正常性をモニタリングすることは、アプリケーションの稼働時間とパフォーマンスを確保するために重要です。モニタリングソリューションを決定するときは、次の点を考慮してください。
-
機能の重要度 — システムに障害が発生した場合、ダウンストリームユーザーへの影響はどの程度重要になるか。
-
エラーの共通性 - システムが故障する頻度はどの程度か。頻繁な介入を必要とするシステムは注意深くモニタリングする必要があります。
-
レイテンシーの増加 — タスクを完了するための時間がどれだけ増加または減少したか。
-
クライアント側とサーバー側のメトリクス — クライアントとサーバー上の関連メトリック間に不一致があるか。
-
依存関係障害 — チームで準備できる、また準備すべき障害。
応答計画を作成した後、モニタリングソリューションを使用して、環境内でインシデントが発生したときにインシデントを自動的に追跡できます。インシデントの追跡と作成の詳細については、「Incident Manager コンソールでのインシデントの詳細の表示」を参照してください。
セキュア、高性能、耐障害性、効率的なインフラストラクチャアプリケーションとワークロードの設計の詳細については、AWS 「 Well-Architected