DevOps Guru でのインサイトの使用 - Amazon DevOps Guru

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

DevOps Guru でのインサイトの使用

Amazon DevOps Guruは、運用アプリケーションで異常な動作を検出するとインサイトを生成します。DevOps Guru は、セットアップ時に指定した AWS リソース内のメトリクスやイベントなどを分析します。各インサイトには、問題を軽減するためのレコメンデーションが含まれています。また、異常な動作を識別するために使用されたメトリクスとロググループのリストも含まれています。

インサイトには 2 つのタイプがあります。

  • 事後対応型インサイトには、現在発生している問題に対処するためのレコメンデーションがあります。

  • 事前対応型インサイトには、DevOps Guru が将来発生すると予測する問題に対処するレコメンデーションがあります。

DevOps Guru インサイトの表示

インサイトは、AWS Management Console を使用して表示できます。

DevOps Guru のインサイトの表示
  1. Amazon DevOps Guru コンソール (https://console.aws.amazon.com/devops-guru/) を開きます。

  2. ナビゲーションペインを開き、[Insights] (インサイト) を選択します。

  3. [Reactive] (事後対応型) タブには、事後対応型インサイトのリストが表示されます。[Proactive] (事前対応型) タブには、事前対応型インサイトのリストが表示されます。

  4. (オプション) 次のフィルターを使用して目的のインサイトを検索します。

    • 目的のインサイトのタイプに応じて [事後対応型] または [事前対応型] タブを選択します。

    • [Filter insights] (インサイトのフィルター) を選択して、フィルターを指定するオプションを選択します。ステータス、重要度、リソース、およびタグフィルターの組み合わせを追加できます。特定のタグを持つリソースによって生成されたインサイトだけを表示するには、AWS タグフィルターを使用します。詳細については、「タグを使用して DevOpsGuru アプリケーションのリソースを識別する」を参照してください。

    注記

    DevOps Guru は次のリソースを分析できますが、タグを使用してインサイトをフィルターすることはできません。

    • Amazon API Gateway のパスとルート

    • Amazon DynamoDB Streams

    • Amazon EC2 Auto Scaling グループインスタンス

    • AWS Elastic Beanstalk 環境

    • Amazon Redshift ノード

    • インサイトの作成時間でフィルターする時間範囲を選択または指定します。

      • [12h] を選択すると、過去 12 時間に作成されたインサイトが表示されます。

      • [1d] を選択すると、過去 1 日に作成されたインサイトが表示されます。

      • [1w] を選択すると、過去 1 週間に作成されたインサイトが表示されます。

      • [1m] を選択すると、過去 1 か月間に作成されたインサイトが表示されます。

      • [Custom] (カスタム) を選択すると、別の時間範囲を指定できます。インサイトのフィルターに使用できる最大時間範囲は 180 日です。

  5. インサイトの詳細を表示するには、その名前を選択します。

DevOps Guru コンソールに表示されるインサイト

Amazon DevOps Guru コンソールを使用して、インサイト内の有用な情報を表示し、異常な動作の診断と対処に役立てることができます。DevOps Guru がリソースを分析し、異常な動作を示す Amazon CloudWatch メトリクス、AWS CloudTrail イベント、および異常な動作を示す運用データを検出すると、問題に対処するためのレコメンデーションと関連するメトリクスおよびイベントに関する情報を含むインサイトが作成されます。インサイトデータと DevOps Guru のベストプラクティスを使用して、DevOps Guru によって検出された運用の問題に対処します。

インサイトを表示するには、「インサイトの表示」のステップに従ってインサイトを見つけて、その名前を選択します。インサイトページには次の詳細が含まれています。

インサイトの概要

このセクションを使用して、インサイトの高レベルの概要を取得します。インサイトのステータス (継続またはクローズ)、影響を受ける AWS CloudFormation スタックの数、インサイトの開始時刻、終了時刻、および最終更新時刻、および関連する運用項目 (存在する場合) を表示できます。

インサイトがスタックレベルでグループ化されている場合、影響を受けるスタックの数を選択して、その名前を表示できます。インサイトを作成した異常な動作は、影響を受けるスタックによって作成されたリソースで発生しています。インサイトがアカウントレベルでグループ化されている場合、数値は 0 であるか、表示されません。

詳細については、「異常行動がインサイトにグループ化される仕組み」を参照してください。

インサイト名

インサイトの名前は、インサイトがスタックレベルでグループされているか、アカウントレベルでグループ化されているかに応じて異なります。

  • スタックレベルのインサイト名には、異常な動作が検出されたリソースを含むスタックの名前が含まれます。

  • アカウントレベルのインサイト名にはスタック名は含まれません。

詳細については、「異常行動がインサイトにグループ化される仕組み」を参照してください。

集約されたメトリクス

[Aggregated metrics] (集約されたメトリクス) タブを選択して、インサイトに関連するメトリクスを表示します。テーブルの各行は 1 つのメトリクスを表します。メトリクスを発行したリソースを作成した AWS CloudFormation スタック、リソースの名前とタイプを表示できます。すべてのメトリクスが AWS CloudFormation スタックに関連付けられているではありません。名前のないメトリクスもあります。

同時に複数のリソースが異常である場合、タイムラインビューはリソースを集約し、分析を簡単にする目的で、その異常なメトリクスを単一のタイムラインに表示します。タイムラインの赤い線は、メトリクスが異常な値を発行した時間範囲を示します。ズームインするには、マウスを使用して特定の時間範囲を選択します。虫眼鏡アイコンを使用してズームイン/ズームアウトすることもできます。

タイムラインの赤い線を選択すると、詳細情報が表示されます。表示されるウィンドウで、次の操作を実行できます。

  • [View in CloudWatch] (CloudWatch で表示) を選択すると、CloudWatch コンソールでメトリクスが表示されます 詳細については、Amazon CloudWatch ユーザーガイドの「Statistics」と「Dimensions」を参照してください。

  • グラフにカーソルを合わせると、異常なメトリクスデータとその発生時間の詳細が表示されます。

  • 下向き矢印の付いたボックスを選択すると、グラフの PNG 画像がダウンロードされます。

グラフに表示された異常

[Graphed anomalies] (グラフに表示された異常) タブを選択すると、各インサイトの異常に関する詳細なグラフが表示されます。各異常に対して 1 つのタイルが表示され、関連する指標で検出された異常な動作の詳細が表示されます。リソースレベルおよび統計ごとに異常を調査して確認できます。グラフはメトリクス名でグループ化されています。各タイルで、タイムラインの特定の時間範囲を選択してズームできます。虫眼鏡アイコンを使用してズームインとズームアウトすることや、定義済みの期間を時間、日、週単位 ([1H]、[3H]、[12H]、[1D]、[3D]、[1W]、または [2W]) で選択することもできます。

[View all statistics and dimensions] (すべての統計とディメンションを表示) を選択すると、異常に関する詳細が表示されます。表示されるウィンドウで、次の操作を実行できます。

  • [View in CloudWatch] (CloudWatch で表示) を選択すると、CloudWatch コンソールでメトリクスが表示されます

  • グラフにカーソルを合わせると、異常なメトリクスデータとその発生時間の詳細が表示されます。

  • [Statistics] (統計) または [Dimension] (ディメンション) を選択すると、グラフの表示をカスタマイズできます。詳細については、Amazon CloudWatch ユーザーガイドの「Statistics」と「Dimensions」を参照してください。

ロググループ

ログ異常検出を有効にすると、DevOps Guru は CloudWatch ロググループにタグを付け、インサイトに関連するロググループを表示できるようにします。インサイト詳細ページの ロググループ セクションでは、表の各行が 1 つのロググループを表し、関連するリソースを一覧表示します。

同時に複数の異常なロググループが存在する場合、タイムラインビューはリソースを集約し、分析を簡単にする目的で、単一のタイムラインに表示します。タイムラインの紫色の線は、ロググループにログ異常が発生した時間範囲を示します。

タイムラインの紫色の線を選択すると、キーワードの例外や数値偏差などのログ異常情報のサンプルが表示されます。[ロググループの詳細を表示] を選択すると、ログの異常が表示されます。表示されるウィンドウで、次の操作を実行できます。

  • ログの異常と関連イベントのグラフを表示します。

  • グラフにカーソルを合わせると、異常なログデータとその発生時間の詳細が表示されます。

  • サンプルメッセージ、発生頻度、関連するリコメンデーション、発生時刻とともにログの異常を詳細に表示できます。

  • [CloudWatch で詳細を表示] をクリックすると、ログ異常のログ行が表示されます。

関連イベント

[Related events] (関連イベント) で、インサイトに関連する AWS CloudTrail イベントを表意jします。これらのイベントを使用して、異常動作の根本的な原因を理解および診断して異常動作に対処します。

レコメンデーション

[Recommendations] (レコメンデーション) で、根本的な問題の解決に役立つ可能性のある推奨事項を表示できます。DevOps Guru が異常な動作を検出すると、レコメンデーションの作成が試みられます。インサイトにレコメンデーションが含まれないこともあります。

異常行動がインサイトにグループ化される仕組み

インサイトは、スタックレベルまたはアカウントレベルでグループ化されます。AWS CloudFormation スタックに含まれるリソースに対して生成されたインサイトはスタックレベルのインサイトです。それ以外のインサイトはアカウントレベルのインサイトです。

スタックがグループ化される方法は、Amazon DevOps Guru でリソース分析カバレッジをどのように構成したかに応じて異なります。

カバレッジが AWS CloudFormation スタックによって定義されている場合

選択したスタックに含まれるすべてのリソースが分析され、検出されたすべてのインサイトはスタックレベルでグループ化されます。

カバレッジが現在の AWS アカウントとリージョンである場合

アカウントとリージョン内のすべてのリソースが分析され、検出されたインサイトには 3 つのグループ化シナリオがあります。

  • スタックの一部ではないリソースの生成されたインサイトは、アカウントレベルでグループ化されます。

  • 最初の 10,000 個の解析されたスタックにあるリソースから生成されたインサイトは、スタックレベルでグループ化されます。

  • 最初の 10,000 個の解析されたスタックにないリソースから生成されたインサイトは、アカウントレベルでグループ化されます。例えば、10,001 番目の分析スタック内のリソースに対して生成されたインサイトは、アカウントレベルでグループ化されます。

詳細については、「DevOpsGuru のカバレッジを決定する」を参照してください。

インサイトの重要度の概要

インサイトには、3 つの重大度 (,, または) があります。Amazon DevOps Guru が関連する異常を検出し、各異常に重要度を割り当てると、インサイトが作成されます。DevOps Guru は、ドメインの知識と長年の集団体験を使用して、異常の重要度 (、または) を割り当てます。インサイトの重要度は、インサイトの作成に寄与した最も重要な異常によって決定されます。

  • インサイトを生成したすべての異常の重要度がである場合、インサイトの重大度はになります。

  • インサイトを生成したすべての異常の最も高い重要度がである場合、インサイトの重大度はになります。インサイトを生成した一部の異常の重要度はである可能性があります。

  • インサイトを生成したすべての異常の最も高い重要度がである場合、インサイトの重大度はになります。インサイトを生成した一部の異常の重要度はまたはである可能性があります。