在 Incident Manager 主控台中檢視事件詳細資訊 - Incident Manager

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 Incident Manager 主控台中檢視事件詳細資訊

AWS Systems Manager Incident Manager 會追蹤您的事件,從偵測到事件的那一刻到解決,以及透過事件後分析。您可以在 Incident Manager 主控台的事件清單頁面上找到所有事件,其中包含直接連結至事件詳細資訊的連結。

在主控台中檢視事件清單

事件清單頁面包含三個區段:開啟事件已解決的事件和分析。您可以手動追蹤新事件,並從此頁面建立分析。若要進一步了解手動追蹤事件,請參閱本指南手動建立事件的事件建立一節。若要了解事後分析,請參閱本指南的 在 Incident Manager 中執行事件後分析一節。

事件詳細資訊會以標題、影響、持續時間和該事件的聊天管道的圖磚顯示開啟事件。在您解決事件之後,它會移至已解決的事件清單。分析位於第二個索引標籤中。

在主控台中檢視事件詳細資訊

事件詳細資訊頁面提供詳細的洞見和工具,您可以用來管理事件。從此頁面,您可以啟動 Runbook 來緩解事件、新增事件備註、與其他解析程式互動,以及檢視事件詳細資訊,例如時間表、指標、屬性和相關資源。

如下圖所示,事件詳細資訊頁面包含數個區段:頂端橫幅、事件備註,以及包含其他資訊和資源的七個索引標籤。根據預設,頂端橫幅和事件備註區段會顯示在所有事件詳細資訊頁面上。

事件詳細資訊頁面包含 7 個標籤,其中包含與事件相關的資訊。

本主題說明事件詳細資訊頁面的元素,以及您可以從頁面執行的動作。

頂端橫幅

每個事件詳細資訊頁面上的頂端橫幅都包含下列資訊:

  • 狀態 – 事件的目前狀態可以是開啟解決

  • 影響 – 事件對您環境的影響。它可以是高、中和低。若要變更事件的影響,請選擇編輯屬性

  • 聊天頻道 – 存取聊天頻道的連結,您可以在其中檢視事件更新和通知。

  • 持續時間 – 回應者解決事件之前經過的時間量。

  • Runbooks – 與此事件相關聯的 Runbook 狀態。狀態可能正在等待輸入成功失敗。如果 Runbook 的狀態正在等待輸入,您可以選擇 Runbook 以檢視動作詳細資訊。您可以選擇失敗以檢視逾時失敗或取消的 Runbook。

  • 參與 – 參與總數和每個參與的狀態。當您建立參與時,其狀態為已參與。確認參與後,狀態會從 Engaged 變更為 Confirmd。Incident Manager 不支援第三方互動的確認。這類參與會維持在 Engaged 狀態。

您可以在橫幅的右上角選擇編輯,以編輯事件標題、影響和聊天頻道。

事件備註

畫面右側會顯示事件備註區段。使用備註,您可以與其他處理事件的使用者合作和通訊。您可以說明您套用的緩解措施、您識別的潛在根本原因,或事件的目前狀態。最佳實務是使用事件備註區段來張貼狀態更新,以及您或其他人對事件採取的動作。如果您需要即時與其他解析程式通訊,請使用 Incident Manager 中提供的聊天頻道。

若要新增備註,請選擇新增事件備註按鈕,然後輸入您的備註。備註可以包含事件狀態或任何其他相關資訊的更新,這些資訊可為其他使用者提供可見性。如有需要,您也可以編輯或刪除事件備註。

注意

具有執行 ssm-incidents:UpdateTimelineEventssm-incidents:DeleteTimelineEvent動作的 IAM 許可的任何使用者都可以編輯和刪除備註。不過,當您與另一個帳戶共用事件時,資源政策不包含 ssm-incidents:DeleteTimelineEvent動作。這可防止與您共用事件的使用者刪除備註。您可以在 AWS CloudTrail 主控台中檢視 Incident Manager 事件中備註的稽核線索。

標籤

事件詳細資訊頁面有七個索引標籤,可讓回應者更輕鬆地在事件期間尋找和檢視資訊。標籤會在標籤名稱中顯示計數器,這表示標籤的更新次數。如需每個標籤內容以及可用動作的詳細資訊,請繼續閱讀。

概觀

概觀索引標籤是回應者的登陸頁面。它包含事件摘要、最近的時間軸事件清單,以及目前的 Runbook 步驟。

回應者使用 摘要來掌握已採取的動作、任何變更的結果、可能的後續步驟,以及事件影響的相關資訊。若要更新摘要,請選擇摘要區段右上角的編輯

重要

如果多個回應者同時編輯摘要欄位,則提交編輯的回應者最後會覆寫所有其他輸入。

最近時間軸事件區段包含由 Incident Manager 填入五個最近事件的時間軸。使用本節來了解事件的狀態,以及最近發生的情況。若要檢視完整的時間軸,請繼續前往時間軸索引標籤。

概觀頁面也會顯示目前的 Runbook 步驟。此步驟可能是在您的 AWS 環境中執行的自動步驟,也可能是回應者一組手動指示。若要檢視完整的 Runbook,包括先前和未來的步驟,請選擇 Runbook 索引標籤。

診斷

診斷索引標籤包含託管 AWS 應用程式和系統的重要資訊,包括指標和啟用後調查結果的相關資訊。

使用指標

Incident Manager 使用 Amazon CloudWatch 填入此索引標籤上的指標和警示圖表。若要進一步了解定義警示和指標的事件管理最佳實務,請參閱本使用者指南監控的事件規劃一節。

新增指標
  • 選擇此標籤右上角的新增

    • 若要從現有的 CloudWatch 儀表板新增指標,請選擇從現有的 CloudWatch 儀表板

      1. 選擇儀表板。這會新增屬於所選儀表板一部分的所有指標和警示。

      2. (選用) 您也可以從儀表板選取指標以檢視特定指標。

    • 選取從 CloudWatch 並貼上指標來源,以新增單一指標。若要複製指標來源:

      1. 透過 https://console.aws.amazon.com/cloudwatch/ 開啟 CloudWatch 主控台。

      2. 在導覽窗格中,選擇指標

      3. 在所有指標索引標籤上,在搜尋欄位中輸入搜尋字詞,例如指標名稱或資源名稱,然後選擇輸入

        例如,如果您搜尋CPUUtilization指標,您會看到與此指標相關聯的命名空間和維度。

      4. 從搜尋中選擇其中一個結果以檢視指標。

      5. 選擇來源索引標籤並複製來源。

指標警示圖形只能透過相關回應計劃新增至事件詳細資訊,或在新增指標時選取從現有的 CloudWatch 儀表板

若要移除指標,請選擇移除,然後從提供的指標下拉式清單中選擇您要移除的指標

從 AWS CodeDeploy 和 檢視問題清單 AWS CloudFormation

啟用問題清單並設定所有必要的許可後,任何可能與特定事件相關的問題清單都會連接到事件。回應者可以在事件詳細資訊頁面上檢視這些調查結果的相關資訊。

從 CodeDeploy 和 CloudFormation 檢視問題清單
  1. 開啟 Incident Manager 主控台

  2. 選擇要調查的事件名稱。

  3. 診斷索引標籤的調查結果區域中,比較任何報告調查結果的開始時間與事件的開始時間。

  4. 若要檢視問題清單的詳細資訊,請在參考欄中選擇 CodeDeploy 或 CloudFormation 問題清單的連結。

時間表

使用時間軸索引標籤來追蹤事件發生期間的事件。Incident Manager 會自動填入時間軸事件,以識別事件發生期間的重要事件。回應者可以根據手動偵測到的發生情況來新增自訂事件。在事件後分析期間,時間軸索引標籤會提供寶貴的洞見,讓您了解如何在未來更好地準備和回應事件。如需事件後分析的詳細資訊,請參閱 在 Incident Manager 中執行事件後分析

若要新增自訂時間軸事件,請選擇新增。使用行事曆選取日期,然後輸入時間。所有時間都會顯示在您的當地時區。提供時間軸中出現事件的簡短描述。

若要編輯現有的自訂事件,請在時間軸上選取事件,然後選擇編輯。您可以變更自訂事件的時間、日期和描述。您只能編輯自訂事件。

執行手冊

事件詳細資訊頁面的 Runbooks 索引標籤可讓回應者檢視 Runbook 步驟並啟動新的 Runbook。

若要啟動新的 Runbook,請在 Runbooks 區段中選擇啟動 Runbook。使用搜尋欄位尋找您要啟動的 Runbook。提供啟動 Runbook 時要使用的任何必要參數和 Runbook 版本。從 Runbooks 索引標籤的事件期間啟動的 Runbook 會使用目前登入帳戶的許可。

若要導覽至 Systems Manager 中的 Runbook 定義,請在 Runbook 下選擇 Runbook 的標題。若要導覽至 Systems Manager 中執行中的 Runbook 執行個體,請選擇執行詳細資訊下的執行詳細資訊。這些頁面會顯示用來啟動 Runbook 的範本,以及目前執行中自動化文件執行個體的特定詳細資訊。

Runbook 步驟區段會顯示所選 Runbook 自動採取或回應者手動執行的步驟清單。這些步驟會隨著成為目前步驟而展開,顯示完成步驟所需的資訊,或步驟執行方式的詳細資訊。自動化完成後,自動 Runbook 步驟會解析。手動步驟需要回應者在每個步驟底部選擇下一步。步驟完成後,步驟輸出會顯示為下拉式清單。

若要取消 Runbook 執行,請選擇取消 Runbook。這將停止執行 Runbook,而不會完成 Runbook 中的任何進一步步驟。

參與

事件詳細資訊的參與索引標籤可推動回應者和團隊的參與。在此索引標籤中,您可以查看參與的人員、已回應的人員,以及哪些回應者將參與作為呈報計畫的一部分。回應者可以直接從此索引標籤與其他聯絡人互動。若要進一步了解如何建立聯絡人和呈報計畫,請參閱本指南的 在 Incident Manager 中建立和設定聯絡人在 Incident Manager 中建立回應者參與的呈報計畫章節。

您可以使用聯絡人和升級計劃來設定回應計劃,以在事件開始時自動開始參與。若要進一步了解如何設定回應計劃,請參閱本指南的 在 Incident Manager 中建立和設定回應計劃一節。

您可以在 資料表中找到每個聯絡人的相關資訊。此資料表包含下列資訊:

  • 名稱 – 顯示其聯絡方式和參與計劃之聯絡詳細資訊頁面的連結。

  • 呈報計畫 – 參與聯絡的呈報計畫連結。

  • 聯絡來源 – 識別與此聯絡互動的服務,例如 AWS Systems Manager 或 PagerDuty。

  • 已參與 – 顯示計畫何時與聯絡人互動,或何時與聯絡人互動,做為呈報計畫的一部分。

  • 已確認 – 顯示聯絡人是否確認參與。

若要確認參與,回應者可以執行下列其中一項操作:

  • 電話 – 出現提示1時輸入 。

  • SMS – 使用提供的程式碼回覆訊息,或在事件的參與索引標籤中輸入提供的程式碼。

  • 電子郵件 – 在事件的參與索引標籤中輸入提供的程式碼。

相關項目標籤用於收集與事件緩解相關的資源。這些資源可以是 ARNs、外部資源的連結,或上傳至 Amazon S3 儲存貯體的檔案。資料表會顯示描述性標題和 ARN、連結或儲存貯體詳細資訊。使用 S3 儲存貯體之前,請參閱《Amazon S3 使用者指南》中的 Amazon S3 的安全最佳實務Amazon S3

將檔案上傳至 Amazon S3 儲存貯體時,版本控制會在該儲存貯體上啟用或停用。在儲存貯體上啟用版本控制時,與現有檔案同名上傳的檔案會新增為檔案的新版本。如果版本控制已暫停,上傳的檔案會與現有檔案名稱相同,以覆寫現有檔案。若要進一步了解版本控制,請參閱《Amazon S3 使用者指南》中的在 S3 儲存貯體中使用版本控制Amazon S3

移除檔案相關項目時,檔案會從事件中移除,但不會從 Amazon S3 儲存貯體中移除。若要進一步了解如何從 Amazon S3 儲存貯體移除物件,請參閱《Amazon S3 使用者指南》中的刪除 Amazon S3 物件Amazon S3

屬性

屬性索引標籤提供事件的下列詳細資訊。

事件屬性區段中,您可以檢視下列項目:

  • 狀態 – 說明事件的目前狀態。事件可以開啟解決

  • 開始時間 – 在 Incident Manager 中建立事件的時間。

  • 解決時間 – 在 Incident Manager 中解決事件的時間。

  • Amazon Resource Name (ARN) – 事件的 ARN。從聊天或搭配 AWS Command Line Interface (AWS CLI) 命令參考事件時,請使用 ARN。

  • 回應計畫 – 識別所選事件的回應計畫。選擇回應計劃會開啟回應計劃的詳細資訊頁面。

  • Parent OpsItem – 識別建立為事件父項的 OpsItem。父 OpsItem 可以有多個相關事件和後續動作項目。選取父 OpsItem 會在 OpsCenter 中開啟 OpsItems 詳細資訊頁面。 OpsCenter

  • 分析 – 識別從此事件建立的分析。從已解決的事件建立分析,以改善您的事件回應程序。選擇分析以開啟分析詳細資訊頁面。

  • 擁有者 – 建立事件的帳戶。

標籤區段中,您可以檢視和編輯與事件記錄相關聯的標籤索引鍵和值。如需 Incident Manager 中標籤的詳細資訊,請參閱 Incident Manager 中的標記資源