環境内の運用上の問題を調査する
注記
Amazon Q Developer の運用調査機能はプレビューリリースであり、変更される可能性があります。現在、米国東部 (バージニア北部) リージョンでのみ利用可能です。
目次
調査を作成する
AWS コンソールページから調査を作成する
CloudWatch アラームページ、CloudWatch メトリクスページ、Lambda モニタリングページなど (これらに限定されません)、複数の AWS コンソールから調査を開始できます。
AWS コンソールページから調査を開始するには
-
調査するメトリクスまたはアラームのグラフで、調査に含める時間範囲を選択します。
-
ページの上部に [Investigate] ボタンがある場合は、そのボタンを選択してから、[Start new investigation] を選択します。
それ以外の場合は、メトリクスの縦の省略記号メニューアイコン
を選択し、[Investigate]、[Start new investigation] を選択します。
-
[Investigate] ペインで、[New investigation title] に調査の名前を入力し、オプションで選択したメトリクスまたはアラームに関するメモを入力します。次に、[Start investigation] を選択します。
調査が開始されます。Amazon Q Developer はテレメトリデータをスキャンして、この状況に関連する可能性のあるデータを見つけます。
-
調査データを大きなペインに移動するには、[Open in full page] を選択します。
-
調査の続行中に実行できる手順の詳細については、「オープン調査を表示して続行する」を参照してください。
Amazon Q チャットから調査を作成する
Amazon Q Developer チャットで、デプロイの問題について質問できます。「Lambda 関数が今日遅いのはなぜですか」などと質問できます。
これを行うと、Amazon Q Developer はフォローアップの質問を行い、問題に関するヘルスチェックを実行する場合があります。ヘルスチェックの後、調査を開始するかどうかについてチャットからプロンプトが表示されます。
詳細およびサンプルの質問については、「AWS に関する Amazon Q Developer とのチャット」を参照してください。
開始後に調査を継続する際に実行できる手順の詳細については、「オープン調査を表示して続行する」を参照してください。
CloudWatch アラームアクションから調査を作成する
CloudWatch アラームを作成するときに、ALARM 状態になったときに自動的に調査を開始するように指定できます。メトリクスアラームと複合アラームの両方を作成できます。アラーム作成の詳細については、「メトリクスに関する警告」および「複合アラームを作成する」を参照してください。
オープン調査を表示して続行する
このセクションのステップを使用して、既存の調査を表示して続行します。
調査を表示して続行するには
-
調査のページをまだ開いていない場合は、次の操作を行います。
CloudWatch コンソール (https://console.aws.amazon.com/cloudwatch/
) を開きます。 -
左のナビゲーションペインで、[AI Operations]、[Investigations] を選択します。
-
調査の名前を選択します。
ヒント
Amazon Q Developer の運用調査が ServiceNow または Jira と統合されている場合は、調査見出しから統合ツールに調査を関連付けることができます。
たとえば、Jira 統合の場合は、調査ヘッダーで [Jira Cloud] にカーソルを合わせ、[Add existing ticket]、[Create new ticket]、[Edit integration]のいずれかを選択します。
まだ統合が設定されていない場合は、統合を設定できます。詳細については、「運用調査を設定する」のステップ 3 を参照してください。
-
[Feed] セクションには、最初に調査を開始するために選択されたメトリクスやアラームなど、調査結果に追加された項目が表示されます。
右側のペインにはタブがあります。[Suggestions] タブを選択します。
-
[Suggestions] タブには、Amazon Q Developer が調査に関連する可能性があると判断した他のテレメトリの観測結果が表示されます。また、Amazon Q Developer が状況に対して検出した考えられる理由や根本原因である仮説が含まれる場合もあります。
観測結果と仮説はどちらも Amazon Q Developer によって自然言語で記述されます。
これには複数のオプションがあります。
-
提案ごとに、[Accept] または [Discard] を選択できます。
[Accept] を選択すると、提案が [Feed] セクションに追加され、Amazon Q Developer はこの情報を使用してさらにスキャンと提案を送信します。
[Discard] を選択すると、提案は [Discarded] タブに移動します。
-
観測タイプの提案ごとに、[Suggestions] タブでグラフを展開するか、CloudWatch コンソールでグラフを開いて詳細を表示できます。
-
観測結果の一部は、Amazon Q Developer が調査の一環として実行した CloudWatch Logs Insights クエリの結果である可能性があります。観測結果が CloudWatch Logs Insights クエリ結果の場合、クエリ自体は観測結果の一部として表示されます。クエリを編集して再実行できます。これを行うには、結果で縦の省略記号メニューアイコン
を選択し、[Open in Logs Insights] を選択します。詳細については、「CloudWatch Logs Insights を使用したログデータの分析」を参照してください。
-
この調査に適用される可能性のある AWS のサービス内のテレメトリがわかっている場合は、そのサービスのコンソールに移動して、テレメトリを調査に追加できます。例えば、調査に Lambda メトリクスを追加するには、次の操作を行います。
-
Lambda のコンソールを開きます。
-
[モニタリング] セクションで、メトリクスを見つけます。
-
メトリクスの縦の省略記号コンテキストメニュー
を開き、[Investigate]、[Add to investigation] を選択し、[Investigate] ペインで調査の名前を選択します。
-
-
[Suggestions] タブで仮説を表示する場合、[Show reasoning] を選択して、Amazon Q Developer が仮説の生成に使用したデータを表示できます。
-
Amazon Q Developer の運用調査をサードパーティーのチケット発行システムと統合している場合は、この調査をそのシステムのチケットにアタッチできます。これを行うには、[Feed] の上の [No ticket attached] にカーソルを合わせ、[Attach ticket] または [Create ticket] を選択します。
-
[Discarded] タブを選択すると、以前に破棄された候補を表示できます。それらの 1 つを結果に追加するには、[Restore to findings] を選択します。
-
結果にメモを追加するには、[Feed] ペインで [New note] を選択します。次に、メモを入力し、[Add] を選択します。
-
-
[Feed] エリアに仮説を追加すると、[Show suggested actions] が表示される場合があります。その場合、これを選択すると、問題に関する仮説が正しいと仮定して、実行できるアクションが表示されます。考えられるアクションは次のとおりです。
-
[Documentation suggestions] は、作業中の問題とその解決方法を理解するのに役立つ AWS ドキュメントへのリンクです。提案されたドキュメントを表示するには、[Review] リンクを選択します。
-
[Runbook suggestions] は、Systems Manager Automation で事前定義されたランブックを活用する提案です。各ランブックは、AWS リソースでタスクを実行するためのいくつかのステップを定義します。
重要
Automation ランブックの実行には料金がかかります。ただし、Amazon Q Developer の運用調査では、提案されたランブックが実行するアクションのプレビューが提供されるため、ランブックを実行するかどうかをより適切に評価できます。オートメーションの料金については、「AWS Systems Manager の料金のオートメーション
」を参照してください。 ランブックアクションの続行については、この手順の次のステップに進む前に「Amazon Q Developer の運用調査で提案されるランブック修復の確認と実行」を参照してください。
-
-
調査を終了するには、[End investigation] を選択し、オプションで最終メモを追加します。次に、[保存] を選択します。
調査ステータスが[Archived]に変わります。調査ページを開き、[Restart investigation] を選択すると、アーカイブされた調査を再開できます。
調査に関連するアラーム状態遷移は、開いている限り調査に追加され続けるため、調査を無期限に開いたままにしないことをお勧めします。
注記
ある時点で、[Completed the analysis] と表示される場合があります。[Finished with the investigation.] が、[Feed] エリアの上に表示されます。その後、検出結果にテレメトリを追加すると、このメッセージが変更され、Amazon Q Developer は検出結果に追加した新しいデータに基づいてテレメトリのスキャンを再開します。
Amazon Q Developer の運用調査で提案されるランブック修復の確認と実行
アクティブな調査の [フィード] エリアに仮説を追加すると、Amazon Q Developer の運用調査に [Show suggested actions] と表示される場合があります。提案されるアクションの 1 つは、問題を手動で修正するのに役立つ情報を含むドキュメントを表示することです。
もう 1 つの提案は、オートメーションランブックを使用して自動的に問題を解決することです。オートメーションは、別の AWS のサービス である Systems Manager の一機能です。オートメーションランブックは、選択したリソースで実行する一連のステップまたはアクションを定義します。各ランブックは、特定の問題に対処するように設計されています。ランブックは、作成、修復、再設定、インストール、トラブルシューティング、修復、複製など、さまざまな運用ニーズに対応できます。オートメーションの詳細については、「AWS Systems Manager オートメーションとの統合」を参照してください。
[開始する前に]
調査でオートメーションランブックを使用する前に、以下の重要な考慮事項に注意してください。
-
ランブックの実行を選択すると、料金が発生します。詳細については、「AWS Systems Manager の料金表
」を参照してください。 -
根本原因とランブックの提案は、自動推論と生成人工知能サービスを活用しています。
重要
ランブックステップの実行と、ランブックの実行中に入力されたパラメータ値の選択によって生じるアクションは、お客様の責任となります。提案されたランブックを編集して、ランブックが期待どおりに動作することの確認が必要になる場合があります。詳細については、「AWS Responsible AI Policy
」を参照してください。 -
ランブックによっては、実行を実行する前にランブックの [Input parameters] の値の入力が必要になる場合があります。
-
ランブックは、オペレータに割り当てられた IAM アクセス許可を使用して実行されます。必要に応じて、別の IAM アクセス許可でサインインしてランブックを実行します。実行されているアクションのアクセス許可に加えて、ランブックステップを実行するための追加の Systems Manager アクセス許可が必要です。詳細については、「AWS Systems Manager ユーザーガイド」の「オートメーションの設定」を参照してください。
Amazon Q Developer の運用調査で提案されるランブックアクションを確認して実行するには
-
提案されるランブックに関する情報を表示するには、[Review] を選択してランブックステップの実行方法に関する情報を確認します。
調査の詳細ページで、[Suggestions] を選択します。
-
[Suggestions] ペインで、調査中の問題のシステム分析に基づいて仮説のリストを確認します。
仮説ごとに、以下のオプションから選択できます。
-
[Show reasoning] — システムが仮説を生成した理由に関する詳細情報を表示します。
-
[View actions] – 問題の提案されるアクションを表示します。すべての仮説に提案されるアクションが含まれるわけではありません。
-
[Accept] – 仮説を受け入れ、調査の [Feed] セクションに追加します。
注記
仮説を受け入れても、関連するランブックソリューションは自動的には実行されません。仮説を受け入れる前に提案されたランブックを表示できますが、ランブックを実行するには仮説を受け入れる必要があります。
-
[Discard] – 仮説を拒否し、それ以上関与しません。
-
-
[View action] を選択した後、[Suggested actions] ペインで、問題に対処するために実行できる推奨アクションのリストを確認します。提案されるアクションには、以下のうち 1 つ以上を含めることができます。
-
[AWS knowledge articles] – 問題に手動で対処するためのステップの説明と、詳細情報へのリンクが提供されます。
-
[AWS documentation] – 問題に関連するユーザードキュメントトピックへのリンクを提供します。
-
[AWS-owned runbooks] – 問題解決を試みるために実行できる、AWS で管理されている 1 つ以上の Automation ランブックを一覧表示します。
-
[Runbooks owned by you] - 問題解決を試みるために実行できる、お客様またはアカウントや組織の他のユーザーが作成した 1 つ以上のカスタムオートメーションランブックを一覧表示します。
注記
システムは、カスタムランブック内のキーワードを評価し、調査対象の問題に関連する用語と比較することで、このランブックのリストを自動的に生成します。
キーワードの一致が多いほど、特定のカスタムランブックが [Runbooks owned by you] で上位に表示されます。
-
-
仮説を確認したら、[Learn more] を選択して特定の提案されるアクションをさらに調べ、関連ドキュメントを読むことができます。[Review details] を選択して、AWS とユーザーが所有する提案されるランブックを調べることもできます。
-
ランブックの [Review details] を選択するときは、次のことを行います。
-
[Runbook description] で、調査対象の問題を修正するためにランブックが実行できるアクションの概要を確認してください。[View steps] を選択してランブックのワークフローを視覚化し、個々のステップの詳細をドリルダウンします。
-
[Input parameters] には、ランブックに必要なパラメータの値を指定します。これらのパラメータはランブックによって異なります。
-
[Execution preview] で、情報を慎重に確認します。この情報は、ランブックの実行を選択した場合の範囲と影響について説明しています。
[Execution preview] のコンテンツでは、次の情報が提供されます。
-
ランブックオペレーションが実行されるアカウントとリージョンの数。
-
実行されるアクションのタイプと、各タイプの実行回数。
アクションタイプには以下のものがあります。
-
Mutating
: ランブックステップは、リソースの作成、変更、または削除を行うアクションを通じて、ターゲットに変更を加えます。 -
Non-Mutating
: ランブックステップは、リソースに関するデータを取得しますが、データに変更を加えることはありません。このカテゴリには通常、Describe
、List
、Get
、および同様の読み取り専用 API アクションが含まれます。 -
Undetermined
: 未確定ステップは、AWS Lambda、AWS Step Functions、または AWS Systems Manager の機能である Run Command など、他のオーケストレーションサービスによって処理される実行を呼び出します。また、未確定ステップは、サードパーティー API を呼び出したり、Python や PowerShell スクリプトを実行したりする場合もあります。Systems Manager Automation は、オーケストレーションプロセスまたはサードパーティー API 実行の結果を検出できないため、それらを評価することができません。これらのステップの結果は、手動で確認して、その影響を判断する必要があります。
サポートされているアクションとその影響タイプについては、「AWS Systems Manager ユーザーガイド」の「ランブックアクションの修復の影響タイプ」を参照してください。
-
-
-
続行するかどうかを決定する前に、プレビュー情報を注意深く確認してください。
この時点で、次のいずれかのアクションを選択できます。
-
停止して、ランブックを実行しない。
-
ランブックを実行する前に入力パラメータを変更します。
-
既に選択したオプションを使用してランブックを実行する。
-
重要
ランブックの実行を選択すると、料金が発生します。詳細については、「AWS Systems Manager の料金表
」を参照してください。 -
-
ランブックを実行する場合は、[Execute] を選択します。
すでに仮説を受け入れている場合は、実行が実行されます。
仮説をまだ受け入れていない場合は、実行前にその仮説を受け入れるように求めるダイアログボックスが表示されます。
ランブックに対して [Execute] を選択すると、そのアクションが調査の [Feed] ペインに追加されます。調査から、結果のメトリクスの新しいデータをモニタリングして、ランブックアクションが問題を修正しているかどうかを確認できます。