OPS10-BP03 ビジネスへの影響に基づいて運用上のイベントの優先度を決定する
運用上のイベントに迅速に対応することは重要ですが、すべてのイベントが同じというわけではありません。ビジネスへの影響に基づいて優先順位を付けて、安全性、財務上の損失、規制違反、評判の低下など、重大な結果を招く可能性のあるイベントも優先的に対処します。
期待される成果: 運用上のイベントへの対応に、ビジネスの運用や目標への潜在的な影響に応じて優先順位が付けられます。これにより、効率的かつ効果的に対応できます。
一般的なアンチパターン:
-
すべてのイベントが同じ緊急度で扱われるため、混乱が生じ、重大な問題への対処が遅れる。
-
影響の大きいイベントと小さいイベントの区別がつかず、リソースの誤配分につながる。
-
組織に明確な優先順位付けのフレームワークがないため、運用上のイベントへの対応に一貫性がなくなる。
-
イベントの優先順位が、ビジネス成果への影響ではなく、報告された順序で決まる。
このベストプラクティスを活用するメリット:
-
重要なビジネス機能が最初に注目されるようにし、潜在的な損害を最小限に抑えます。
-
複数のイベントが同時に発生した際のリソース配分が改善されます。
-
組織の信頼を維持し、規制要件を満たす能力を高めます。
このベストプラクティスを活用しない場合のリスクレベル: 高
実装のガイダンス
複数の運用上のイベントに直面した際には、影響と緊急性に基づいて優先順位を決める体系的なアプローチが重要です。このアプローチは、情報に基づいた意思決定を行い、最も必要なところに努力を振り向け、事業継続に対するリスクを軽減するのに役立ちます。
実装手順
-
影響を評価する: ビジネスの運用や目標への潜在的な影響の観点からイベントの重大度を評価するための分類システムを開発します。次の例は、影響のカテゴリを示しています。
影響度 説明 高い
多くのスタッフや顧客に影響を及ぼす、財務上の影響が大きい、評判への悪影響が大きい、または怪我につながる。
中程度
スタッフや顧客のグループに影響を及ぼす。財務上の影響が中程度、または評判への悪影響が中程度である。
低
個々のスタッフまたは顧客に影響を及ぼす、財務上の影響が小さい、または評判への悪影響が小さい。
-
緊急度を評価する: 安全性、財務上の影響、サービスレベル契約 (SLA) などの要素を考慮して、イベントにどれだけ迅速に対応する必要があるかを示す緊急度を定義します。次の例は、緊急度のカテゴリを示しています。
緊急度 説明 高い
被害が指数関数的に大きくなる、時間的制約のある作業に影響が出ている、差し迫ったエスカレーションが発生している、VIP ユーザーやグループに影響が出ている。
中程度
被害が時間の経過とともに大きくなる、または 1 人の VIP ユーザーまたは 1 つのグループが影響を受けている。
低
時間の経過とともにわずかながら被害が大きくなる、または時間的制約のない作業に影響が出ている。
-
優先順位付けのマトリクスを作成する:
-
マトリクスを使用して影響と緊急性を相互参照し、さまざまな組み合わせに優先度を割り当てます。
-
運用上のイベント対応を担当するチームメンバー全員がマトリクスにアクセスし、理解できるようにしてください。
-
次のマトリクスの例は、緊急性と影響に応じたインシデントの重大度を示しています。
緊急性と影響 高い 中程度 低 高い
[非常事態]
緊急
高い
中程度
緊急
高い
[普通]
低
高い
[普通]
低
-
-
トレーニングとコミュニケーションを行う: 優先順位付けのマトリクスと、イベント発生時にそれに従うことの重要性について、対応チームにトレーニングを行います。優先順位付けのプロセスをすべてのステークホルダーに伝え、明確な期待値を設定します。
-
インシデント対応に統合する:
-
優先順位付けのマトリクスをインシデント対応計画とツールに組み込みます。
-
可能な場合は、イベントの分類と優先順位付けを自動化して、対応時間を短縮します。
-
エンタープライズサポートのお客様は、AWS Incident Detection and Response
を使用できます。これにより、24 時間 365 日の本番ワークロードのプロアクティブモニタリングとインシデント管理が可能になります。
-
-
見直して適応させる: 優先順位付けプロセスの有効性を定期的に見直し、フィードバックやビジネス環境の変化に応じて調整します。
リソース
関連するベストプラクティス:
関連ドキュメント: