在 DevOpsGuru 中使用洞見 - Amazon DevOps Guru

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

在 DevOpsGuru 中使用洞見

Amazon DevOpsGuru 會在偵測到營運應用程式中的異常行為時產生洞見。DevOpsGuru 會分析您在設定 DevOpsGuru 時所指定 AWS 資源中的指標、事件等。每個洞見都包含一或多個建議,供您採取以減輕問題。它也包含指標清單、日誌群組清單,以及用於識別異常行為的事件清單。

有兩種洞見類型。

  • 被動洞見提供建議,您可以採取這些建議來解決現在發生的問題。

  • 主動洞見提供建議,以解決 DevOpsGuru 預測未來將發生的問題。

檢視 DevOpsGuru 洞見

您可以使用 檢視您的洞見 AWS Management Console。

檢視您的 DevOpsGuru 洞見
  1. https://console.aws.amazon.com/devops-guru/:// 開啟 Amazon DevOpsGuru 主控台。

  2. 開啟導覽窗格,然後選擇 Insights

  3. 被動索引標籤上,您可以看到被動洞察的清單。在主動索引標籤上,您可以看到主動洞察的清單。

  4. (選用) 使用下列一或多個篩選條件來尋找您要尋找的洞見。

    • 根據您要尋找的洞見類型,選擇被動主動索引標籤。

    • 選擇篩選洞察,然後選擇一個選項來指定篩選條件。您可以新增狀態、嚴重性、資源和標籤篩選條件的組合。使用 AWS 標籤篩選條件,僅檢視具有特定標籤的資源所產生的洞見。如需進一步了解,請參閱 使用標籤來識別 DevOpsGuru 應用程式中的資源

    注意

    DevOpsGuru 可以分析下列資源,但無法使用標籤篩選其洞見。

    • Amazon API Gateway 路徑和路由

    • Amazon DynamoDB Streams

    • Amazon EC2 Auto Scaling 群組執行個體

    • AWS Elastic Beanstalk 環境

    • Amazon Redshift 節點

    • 選擇或指定時間範圍,依洞見建立時間進行篩選。

      • 12 小時顯示過去 12 小時內建立的洞見。

      • 1d 顯示過去一天建立的洞見。

      • 1w 顯示過去一週建立的洞見。

      • 1m 顯示上個月建立的洞見。

      • 自訂可讓您指定另一個時間範圍。您可以使用 來篩選洞見的時間範圍上限為 180 天。

  5. 若要檢視洞見的詳細資訊,請選擇其名稱。

了解 DevOpsGuru 主控台中的洞見

使用 Amazon DevOpsGuru 主控台檢視洞見中的實用資訊,以協助您診斷和解決異常行為。當 DevOpsGuru 分析您的資源,並找到顯示異常行為的相關 Amazon CloudWatch 指標、 AWS CloudTrail 事件和操作資料時,它會建立洞見,其中包含解決相關指標和事件的問題和資訊的建議。搭配 使用洞見資料DevOpsGuru 的最佳實務,解決 DevOpsGuru 偵測到的操作問題。

若要檢視洞見,請依照 中的步驟檢視洞見尋找洞見,然後選擇其名稱。洞見頁面包含下列詳細資訊。

Insight 概觀

使用本節來取得洞見的高階概觀。您可以查看洞見的狀態 (進行中已關閉)、受影響的 AWS CloudFormation 堆疊數量、洞見的開始、結束和上次更新的時間,以及如果有相關的操作項目。

如果洞見在堆疊層級分組,則您可以選擇受影響的堆疊數量來查看其名稱。建立洞見的異常行為發生在受影響堆疊建立的資源中。如果在帳戶層級將洞見分組,則數字為零或不會顯示。

如需詳細資訊,請參閱了解異常行為如何分組為洞見

洞見名稱

洞見的名稱取決於是在堆疊層級帳戶層級分組。

  • 堆疊層級洞見名稱包含堆疊的名稱,其中包含具有異常行為的資源。

  • 帳戶層級洞見名稱不包含堆疊名稱。

如需詳細資訊,請參閱了解異常行為如何分組為洞見

彙總指標

選擇彙總指標索引標籤,以檢視與洞見相關的指標。在表格中,每一列代表一個指標。您可以查看哪些 AWS CloudFormation 堆疊建立發出指標的資源、資源名稱及其類型。並非所有指標都與 AWS CloudFormation 堆疊相關聯或具有名稱。

當同時有多個資源異常時,時間軸檢視會彙總資源,並在單一時間軸中呈現其異常指標,以便於分析。時間軸上的紅線表示指標發出異常值時的時間範圍。若要放大,請使用滑鼠選擇特定的時間範圍。您也可以使用放大鏡圖示來放大和縮小。

選擇時間軸中的紅線以檢視詳細資訊。在開啟的視窗中,您可以:

  • 選擇 CloudWatch 中的檢視,以查看 CloudWatch 主控台中的指標外觀。如需詳細資訊,請參閱《Amazon CloudWatch 使用者指南》中的統計資料維度

  • 將滑鼠暫留在圖形上,以檢視異常指標資料的詳細資訊,以及發生時間。

  • 選擇具有向下箭頭的方塊,以下載圖形的 PNG 影像。

圖形異常

選擇圖形異常索引標籤,以檢視每個洞見的異常的詳細圖形。每個異常都會出現一個圖磚,其中包含相關指標中偵測到的異常行為的詳細資訊。您可以在資源層級和每個統計資料上調查並查看異常。圖形會依指標名稱分組。在每個圖磚中,您可以選擇時間軸中要縮放的特定時間範圍。您也可以使用放大鏡圖示來放大和縮小,或以小時、天或週為單位選擇預先定義的持續時間 (1H3H12H1D3D1W2W)。

選擇檢視所有統計資料和維度,以查看異常的詳細資訊。在開啟的視窗中,您可以:

  • 選擇 CloudWatch 中的檢視,以查看 CloudWatch 主控台中的指標外觀。

  • 將滑鼠暫留在圖形上,以檢視異常指標資料的詳細資訊,以及發生時間。

  • 選擇統計資料維度來自訂圖形的顯示。如需詳細資訊,請參閱《Amazon CloudWatch 使用者指南》中的統計資料維度

日誌群組

當您啟用日誌異常偵測時,DevOps 會標記您的 CloudWatch 日誌群組,以便您可以檢視與洞見相關的日誌群組。在洞見詳細資訊頁面上的日誌群組區段中,資料表中的每一列代表一個日誌群組並列出相關資源。

當同時有多個異常日誌群組時,時間軸檢視會彙總它們,並以單一時間軸呈現它們,以便於分析。時間軸上的紫色線條表示日誌群組遇到日誌異常時所經過的時間。

在時間軸中選擇紫色行,以檢視日誌異常資訊的範例,例如關鍵字例外狀況和數值偏差。選擇檢視日誌群組詳細資訊以檢視日誌異常。在開啟的視窗中,您可以:

  • 檢視日誌異常和相關事件的圖表。

  • 將滑鼠暫留在圖形上,以檢視異常日誌資料的詳細資訊,以及日誌資料何時發生。

  • 詳細檢視日誌異常,其中包含範例訊息、發生頻率、相關建議和發生時間。

  • 按一下 CloudWatch 中的檢視詳細資訊,以檢視來自日誌異常的日誌行。

相關事件

相關事件中,檢視與您的洞見相關的 AWS CloudTrail 事件。使用這些事件來協助了解、診斷和解決異常行為的根本原因。

建議

建議中,您可以檢視可能有助於解決基礎問題的建議。當 DevOpsGuru 偵測到異常行為時,它會嘗試建立建議。洞見可能包含一個、多個或零建議。

了解異常行為如何分組為洞見

洞見會在堆疊層級帳戶層級分組。如果為堆疊中的 AWS CloudFormation 資源產生洞見,則它是堆疊層級洞見。否則,它是帳戶層級洞見。

堆疊的分組方式取決於您在 Amazon DevOpsGuru 中設定資源分析涵蓋範圍的方式。

如果您的涵蓋範圍是由 AWS CloudFormation 堆疊定義

您選擇的堆疊中包含的所有資源都會進行分析,所有偵測到的洞見都會在堆疊層級分組。

如果您的涵蓋範圍是您目前的 AWS 帳戶和區域

分析您帳戶和區域中的所有資源,偵測到的洞見有三種可能的分組案例。

  • 從不屬於堆疊的資源產生的洞見會在帳戶層級分組。

  • 從前 10,000 個已分析堆疊之一的資源產生的洞見,會在堆疊層級分組。

  • 從不在前 10,000 個分析堆疊之一的資源產生的洞見會在帳戶層級分組。例如,針對第 10,001 個分析堆疊中資源產生的洞見會在帳戶層級分組。

如需詳細資訊,請參閱判斷 DevOpsGuru 的涵蓋範圍

了解洞見嚴重性

洞見可以有三個嚴重性之一,。Amazon DevOpsGuru 在偵測到相關異常並為每個異常指派嚴重性之後,會建立洞見。DevOpsGuru 會使用網域知識和多年的集體經驗,將嚴重度指派為。洞見的嚴重性取決於有助於建立洞見的最嚴重異常。

  • 如果產生洞見的所有異常的嚴重性都很低,則洞見的嚴重性很

  • 如果產生洞見的所有異常的最高嚴重性為中等,則洞見的嚴重性為中等。產生洞見的一些異常的嚴重性可能很低

  • 如果產生洞見的所有異常的最高嚴重性都很高,則洞見的嚴重性很高。產生洞見的一些異常的嚴重性可能很低中等