DevOps Guru の概念 - Amazon DevOps Guru

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

DevOps Guru の概念

以下の概念は、Amazon DevOps Guru の仕組みを理解する際に重要です。

異常

異常とは、DevOps Guru によって検出された予期されない、または通常とは異なる関連メトリクスを表します。DevOps Guru は、AWS リソースに関連するメトリクスと運用データを分析する機械学習を使用して異常を生成します。Amazon DevOps Guru をセットアップするとき、分析する AWS リソースを指定します。詳細については、「Amazon DevOpsGuru のセットアップ」を参照してください。

インサイト

インサイトは、DevOps Guru をセットアップするときに指定した AWS リソースの分析時に作成される異常のコレクションです。各インサイトには、運用パフォーマンスを改善するために使用できる観測値、レコメンデーション、および分析データが含まれます。インサイトには 2 つのタイプがあります。

  • 事後対応型: 事後対応型インサイトは、異常が発生したときに異常を識別します。これには、現在の問題を理解して対処するのに役立つレコメンデーション、関連するメトリクス、およびイベントを含む異常が含まれています。

  • 事前対応型: 事前対応型インサイトでは、異常な動作が発生する前に異常を知ることができます。これには、問題の発生が予測される前に問題に対処するのに役立つレコメンデーションを含む異常が含まれています。

メトリクスと運用イベント

インサイトを構成する異常は、Amazon CloudWatch によって返されるメトリクスおよび AWS リソースによって発行される運用イベントによって生成されます。アプリケーションの問題をよりよく理解するのに役立つ、インサイトを作成するメトリクスと運用イベントを表示できます。

ロググループとログ異常

ログ異常検出を有効にすると、関連するロググループが DevOps Guru コンソールの DevOps Guru インサイトページに表示されます。ロググループを使用すると、リソースのパフォーマンスやアクセス状況に関する重要な診断情報を知ることができます。

ログ異常とは、ロググループで見つかった類似の異常なログイベントのクラスターを表します。DevOps Guru に表示される異常なログイベントの例には、キーワードの異常、フォーマットの異常、HTTP コードの異常などがあります。

ログ異常を使用して、運用上の問題の根本原因を診断できます。また、DevOps Guru はインサイトレコメンデーションのログラインを参照して、推奨ソリューションのコンテキストを詳しく説明します。

注記

DevOps Guru は Amazon CloudWatch と連携して、ログ異常検出を可能にします。ログ異常検出を有効にすると、DevOps Guru は CloudWatch のロググループにタグを追加します。ログ異常検出を無効にすると、DevOps Guru は CloudWatch のロググループからタグを削除します。

さらに、管理者は、CloudWatch のログを閲覧する権限を持つユーザーのみが、異常な CloudWatch のログを閲覧する権限を持っていることを確認する必要があります。IAM ポリシーを使用して、ListAnomalousLogs オペレーションへのアクセスを許可または拒否することをお勧めします。詳細については、[DevOps Guru のアイデンティティとアクセス管理] を参照してください。

レコメンデーション

各インサイトは、アプリケーションのパフォーマンス向上に役立つレコメンデーションを提供します。レコメンデーションには、以下が含まれます。

  • インサイトを構成する異常に対処するためのレコメンデーションアクションの説明。

  • DevOps Guru が異常な動作を検出した分析済みメトリクスのリスト。各メトリクスには、メトリクスに関連付けられたリソースを生成した AWS CloudFormation スタック、リソースの名前、およびリソースに関連付けられている AWS のサービスの名前が含まれます。

  • インサイトに関連付けられている異常メトリクスに関連するイベントのリスト。関連する各イベントには、イベントに関連付けられたリソースを生成した AWS CloudFormation スタック、イベントを生成したリソースの名前、およびイベントに関連付けられた AWS サービスの名前が含まれます。

  • インサイトに関連付けられている異常な動作に関連するロググループのリスト。各ロググループには、サンプルログメッセージ、報告されたログ異常の種類に関する情報、ログ異常が発生した時間、および CloudWatch のログの行を表示するリンクが含まれています。