View a markdown version of this page

自律型インシデント対応 - AWS DevOps エージェント

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

自律型インシデント対応

調査の開始

インシデント対応調査は、3 つの方法のいずれかで開始できます。

  • 組み込み統合 - 組み込み統合を使用して、DevOps エージェントスペースを ServiceNow などのチケット発行システムに接続できます。接続されると、DevOps Agent のインシデント対応調査はサポートチケットから自動的にトリガーされ、DevOps Agent は主要な検出結果、根本原因分析、緩和計画の更新を元のチケットに提供します。

  • ウェブフック - ウェブフックを使用して、 AWS DevOps エージェントにイベントを送信できます。たとえば、ウェブフックを使用して PagerDuty チケットまたは Grafana アラームからインシデント対応調査をトリガーできます。

  • 手動 - DevOps エージェントスペースウェブアプリケーションのインシデント対応タブからインシデント対応調査を手動で開始できます。DevOps エージェントが調査するインシデントを説明する自由形式のテキストを入力すると、調査計画の作成、結果の収集、根本原因の特定、緩和計画の生成の提案を行うことができます。いくつかの事前設定された開始点から選択して、調査をすばやく開始することもできます。 最後にトリガーされたアラームを調査し、基盤となるメトリクスとログを分析して根本原因を特定する最新のアラーム、コンピューティングリソース全体で高い CPU 使用率メトリクスを調査して過剰なリソースを消費しているプロセスやサービスを特定する CPU 使用率が高いアラーム、メトリクス、アプリケーションログを分析して障害の原因を特定することで、アプリケーションのエラー率の最近の増加を調査するエラー率の急増。

説明フィールド、提案ボタン、調査開始ボタンを含む調査フォーム。

「調査の開始」をクリックすると、エージェントが作業に集中するのに役立つ追加の詳細を入力するように求められます。調査ダイアログには、次のフィールドが含まれます。

  • 調査の詳細 – 説明があらかじめ入力されています。これを編集して調査範囲を絞り込むことができます。

  • 調査の開始点 – 必要に応じて、エージェントの特定のアラーム、メトリクス、ログスニペット、またはその他の開始点を記述します。

  • インシデントの日時 – 現在の時刻が UTC 形式で自動入力されます。インシデントが以前に発生したかどうかを調整します。

  • 調査に名前を付ける – タイムスタンプ付きで自動生成されます。これをカスタマイズできます (最大 400 文字)。

  • Priority – ドロップダウンから調査の優先度を選択します (Medium がデフォルトです)。

必要に応じてこれらのフィールドを確認して調整し、「調査を開始する...」をクリックして開始します。その後、調査の詳細ページに移動し、DevOps エージェントの動作を確認できます。

インシデントのトリアージ

トリアージフェーズは、 AWS DevOps エージェントのインシデント対応システムの最初のステージです。Datadog からのアラーム、ServiceNow からのインシデントチケット、Dynatrace の問題などの外部イベントがトリガーされると、 AWS DevOps Agent はそれを数秒以内に自動的に処理して、個別に調査するか、既存の調査にリンクするかを判断します。

トリアージステージの主な機能はインシデント相関です。関連するインシデントを特定し、それらを 1 つの調査に統合して、重複する作業とリソースの無駄を回避します。新しいインシデントが到着すると、 AWS DevOps Agent はルックバックウィンドウ (通常は 20 分) 内でアクティブな調査とともに分析します。AI を活用した分析を使用して、コンポーネントの類似性、地理的リージョン、タイミングパターンなどの要因を調べ、インシデント間の関係を判断します。

AWS DevOps Agent は、次の 2 つの決定のいずれかを行います。

  • リンク済み – インシデントを既存の調査に関連付け、新しいインシデントに関するコンテキストを含むステアリングメッセージをその調査に送信します。

  • 続行 — インシデントの新しい独立した調査をスケジュールします。

トリアージ決定の表示

インシデントがリンクされると、プライマリ調査は、リンクされたインシデントの詳細と相関の推論を含むステアリングメッセージを受信します。 AWS DevOps エージェントスペースウェブアプリでは、インシデントがリンクされた理由を説明する相関推論とともに、LINKED のステータスが表示されます。プライマリ調査では、リンクされたすべてのインシデントのリストが表示され、調査中の関連する問題の全範囲を確認できます。外部チケットシステム (ServiceNow、PagerDuty など) と通信チャネル (Slack) は、相関推論とともにインシデントがリンクされたという通知を受け取ります。

インシデントとカスタム相関ルールのリンク解除

AWS DevOps Agent が誤ってインシデントを関連付けている場合は、 AWS DevOps Agent Space ウェブアプリを使用して手動でリンクを解除できます。これにより、リンクされていないインシデントが独立した調査として再スケジュールされます。相関ロジックを含む AWS DevOps エージェントスキルを作成し、トリアージステージに関連付けることで、 AWS DevOps エージェントをガイドするカスタム相関ルールを提供することもできます。

人間によるサポートを依頼する

AWS DevOps エージェントは AWS サポートに直接接続して、インシデント対応プロセスを合理化できます。 AWS サポートから追加のサポートが必要な場合は、DevOps Agent Space ウェブアプリからサポートケースを作成し、 AWS サポートエンジニアと調査コンテキストを自動的に共有して、問題を説明するのに必要な時間を短縮できます。

仕組み

インシデントを調査する際、 AWS DevOps Agent は分析の包括的なログを構築します。これには以下が含まれます。

  • 根本原因の調査結果

  • 分析されたメトリクス、ログ、トレース

  • コード変更とデプロイ履歴の確認

  • 推奨される修復アクション

  • イベントとシステム動作のタイムライン

AWS DevOps エージェントスペースウェブアプリから直接、調査を AWS Support にエスカレーションできます。これを行うと、 AWS DevOps Agent は自動的に調査ログを AWS サポートに渡し、詳細を手動で収集して説明することなく、調査に関する完全なコンテキストをサポートエンジニアに提供します。

AWS サポートとのチャット

サポートケースを作成したら、 AWS DevOps エージェントスペースウェブアプリ内の別のチャットウィンドウで AWS サポートと通信できます。これにより、次のことが可能になります。

  • AWS DevOps エージェントの調査タイムラインとともに、 AWS サポートエンジニアと問題について話し合う

  • AWS DevOps Agent の自動分析と AWS Support のエキスパートガイダンスの両方を同じインターフェイスで表示する

  • 必要に応じて追加情報や明確化をシームレスに共有する

チャットエクスペリエンスにより、 AWS DevOps エージェントの調査と AWS サポートの会話に簡単にアクセスできるため、コラボレーションと解決が迅速になります。

サポートケース言語

AWS DevOps Agent を使用してサポートケースを作成すると、そのケースはエージェントスペースのエージェントレスポンス言語設定で設定された言語で自動的に作成されます。これにより、サポートケースは、希望する言語を話すサポートエンジニアにルーティングされます。

例えば、エージェントスペース言語が日本語に設定されている場合、サポートケースは日本語サポートエンジニアにルーティングされます。言語が設定されていない場合、または設定された言語が選択したケースカテゴリ AWS のサポートでサポートされていない場合、ケースはデフォルトで英語になります。

AWS サポートは現在、ケースルーティングに中国語、英語、フランス語、日本語、韓国語、ポルトガル語、スペイン語をサポートしています。サポートケースに使用される言語を変更するには、エージェントスペース設定のエージェントレスポンス言語設定を更新します。詳細については、「エージェントスペースの作成」を参照してください。

サポートプランの要件

AWS DevOps Agent を通じてサポートケースを作成して操作できるかどうかは、 AWS サポートプランによって異なります。使用権限の詳細については、 Support Plans ユーザーガイドを参照してください。

ベーシックサポートのお客様はテクニカルサポートケースを作成できないため、 AWS DevOps エージェントの調査を AWS Support Developer Support にエスカレーションすることはできません。したがって、お客様は AWS DevOps Agent を通じてケースを作成できますが、サポートセンターにアクセスしてサポートエンジニアAWSに対応する必要があります。デベロッパーサポートにはチャットベースのサポートが含まれていないためです。他のすべてのプランでは、 AWS DevOps Agent 内で統合されたチャットエクスペリエンスを使用できます。応答時間や利用可能なケース重要度など、サポートプランの使用権限の詳細については、AWS 「サポートプランユーザーガイド」を参照してください。

AWS サポートと共有される情報

AWS DevOps Agent Space ウェブアプリからサポートケースを作成すると、次の情報が AWS Support に自動的に共有されます。

  • 調査タイムライン: AWS DevOps Agent の分析の時系列レコード

  • リソース情報: 影響を受ける AWS リソース

  • オブザーバビリティデータ: 統合されたモニタリングツールからの関連するメトリクス、ログ、トレース

  • 最近の変更: コードのデプロイ、インフラストラクチャの変更、設定の更新

  • 修復の試行: Actions AWS DevOps Agent を推奨

  • 影響評価: インシデントの範囲と重大度

AWS サポートと共有されるすべてのデータは、既存の AWS データレジデンシーとセキュリティ設定に従います。 AWS DevOps Agent は、特定の調査に関連する情報のみを共有し、組織のデータガバナンスポリシーを尊重します。

開始方法

AWS DevOps Agent AWS のサポート統合を使用するには:

  1. アクティブな AWS サポートプランがあることを確認します。

  2. AWS DevOps エージェントの IAM アクセス許可にサポートケースの作成 (support:CreateCase、support:DescribeCases) が含まれていることを確認します。

  3. AWS DevOps Agent が問題を調査していて、 AWS サポートサポートが必要な場合は、DevOps Agent Space ウェブアプリから人間によるサポートを依頼を選択します。

  4. AWS サポートと共有される調査の概要を確認します。

  5. サポートプランの使用権限に基づいて、適切なケース重要度を選択します。

  6. ケースを送信する - AWS DevOps Agent には調査ログが自動的に含まれます。

チャットウィンドウが自動的に開き、すぐに AWS サポートとのコラボレーションを開始できます。