セットアップと設定 CloudWatch メトリクス CloudWatch ログログタイプリファレンス CloudWatch Logs Insights を使用したログの分析 OpenSearch Service を使用してログを分析するログ形式の移行

CloudWatch を使用した GraphQL API データのモニタリングとログ

CloudWatch メトリクスと CloudWatch ログを使用して、GraphQL API のログとデバッグを行うことができます。これらのツールにより、デベロッパーはパフォーマンスのモニタリング、問題のトラブルシューティング、GraphQL オペレーションの最適化を効果的に行うことができます。

CloudWatch メトリクスは、API のパフォーマンスと使用状況をモニタリングするための幅広いメトリクスを提供するツールです。これらのメトリクスは、2 つの主なカテゴリに分類されます。

一般的な API メトリクス: これには、クライアントとサーバーのエラーを追跡するための 4XXError および 5XXError、レスポンスタイムを測定するための Latency、API コールの合計をモニタリングするための Requests、リソース使用状況を追跡するための TokensConsumed が含まれます。
リアルタイムサブスクリプションメトリクス: これらのメトリクスは、WebSocket 接続とサブスクリプションアクティビティに焦点を当てています。これには、接続リクエスト、成功した接続、サブスクリプション登録、メッセージ発行、アクティブな接続とサブスクリプションのメトリクスが含まれます。

このガイドでは、リゾルバーのパフォーマンス、データソースインタラクション、個々の GraphQL オペレーションに関するより詳細なデータを提供する拡張メトリクスも紹介しています。これらのメトリクスは、より深いインサイトを提供しますが、追加コストが発生します。

CloudWatch Logs は、GraphQL API のログ機能を有効にするツールです。ログは API の 2 つのレベルで設定できます。

リクエストレベルのログ: HTTP ヘッダー、GraphQL クエリ、オペレーションの概要、サブスクリプション登録など、全体的なリクエスト情報をキャプチャします。
フィールドレベルのログ: リクエストとレスポンスのマッピング、各フィールドのトレース情報など、個々のフィールド解決に関する詳細情報を提供します。

ログ記録の設定、ログエントリの解釈、トラブルシューティングと最適化のためのログデータの使用を行うことができます。 AWS AppSync には、クエリの実行、解析、検証、およびフィールド解決データを明らかにするさまざまなログタイプが用意されています。

セットアップと設定

GraphQL API で自動ログ記録を有効にするには、 AWS AppSync コンソールを使用します。

にサインイン AWS Management Console し、AppSync コンソールを開きます。
API] ページで、GraphQL API の名前を選択します。
API のホームページのナビゲーションペインで、[設定] を選択します。
[ログ記録] で以下を行います。
1. [ログを有効にする] をオンにします。
2. リクエストレベルの詳細なロギングを行うには、[詳細な内容を含める] のチェックボックスをオンにします。(オプション)
3. フィールドリゾルバーのログレベルで、任意のフィールドレベルのログ記録レベル (なし、エラー、情報、デバッグ、またはすべて) を選択します (オプション）。
4. 「既存のロールを作成または使用する」で、「新しいロール」を選択して、 AWS AppSync が CloudWatch にログを書き込むことを許可する新しい AWS Identity and Access Management (IAM) を作成します。または、[既存のロール] を選択して、 AWS アカウント内の既存の IAM ロールの Amazon リソースネーム (ARN) を選択します。
[Save] を選択します。

手動での IAM ロールの設定

既存の IAM ロールを使用する場合、ロールは CloudWatch にログを書き込むために必要なアクセス許可を AWS AppSync に付与する必要があります。これを手動で設定するには、 AWS AppSync がログを書き込むときにロールを引き受けられるように、サービスロール ARN を指定する必要があります。

IAM コンソールで、AWSAppSyncPushToCloudWatchLogsPolicy という名前の新しいポリシーを、以下の定義で作成します。


{
    "Version": "2012-10-17",
    "Statement": [
        {
            "Effect": "Allow",
            "Action": [
                "logs:CreateLogGroup",
                "logs:CreateLogStream",
                "logs:PutLogEvents"
            ],
            "Resource": "*"
        }
    ]
}

次に、AWSAppSyncPushToCloudWatchLogsRole という名前で新しいロールを作成し、新しく作成したポリシーをこのロールにアタッチします。このロールの信頼関係を次のように編集します。


{
    "Version": "2012-10-17",
    "Statement": [
        {
        "Effect": "Allow",
        "Principal": {
            "Service": "appsync.amazonaws.com"
        },
        "Action": "sts:AssumeRole"
        }
    ]
}

ロール ARN をコピーし、 AWS AppSync GraphQL API のログ記録を設定するときに使用します。

CloudWatch メトリクス

CloudWatch メトリクスを使用して、HTTP ステータスコードやレイテンシーの原因となる特定のイベントを監視し、アラートを出すことができます。以下のメトリクスが出力されます。

4XXError

クライアントの設定が正しくないためにリクエストが無効になったために発生するエラー。通常、GraphQL を実行する外部の任意の場所で、これらのエラーが発生します。たとえば、このエラーは、リクエストに誤った JSON ペイロードまたは誤ったクエリが含まれている場合、サービスがスロットリングされている場合、または Auth 設定が誤って構成されている場合に発生する可能性があります。

単位: カウントこれらのエラーの出現総数を取得するために、Sum 統計を使用します。

5XXError

GraphQL クエリの実行中に発生したエラー。例えば、空のスキーマや不正確なスキーマに対してクエリを実行した場合に発生する可能性があります。また、Amazon Cognito ユーザープール ID または AWS リージョンが有効でない場合にも発生する可能性があります。また、リクエストの処理中に AWS AppSync で問題が発生した場合にもこれが発生することがあります。

単位: カウントこれらのエラーの出現総数を取得するために、Sum 統計を使用します。

Latency

AWS AppSync がクライアントからリクエストを受信してからクライアントにレスポンスを返すまでの時間。エンドデバイスに到達するレスポンスに発生したネットワークレイテンシーは含まれません。

単位: ミリ秒 予測されるレイテンシーを評価するために Average 統計を使用します。

Requests

アカウント内のすべての API が処理したリクエスト (クエリ + ミューテーション) の数 (リージョン別)。

単位: カウント特定のリージョンで処理されたすべてのリクエストの数。

TokensConsumed

トークンは、Request が使用するリソースの量 (処理時間と使用量) に基づいて Requests に割り当てられます。通常、それぞれの Request が 1 つのトークンを消費します。ただし、Request が大量のリソースを消費する場合には、必要に応じて追加のトークンが割り当てられます。

単位: カウント特定のリージョンで処理されたリクエストに割り当てられるトークンの数。

NetworkBandwidthOutAllowanceExceeded

注記

AWS AppSync コンソールのキャッシュ設定ページで、キャッシュヘルスメトリクスオプションを使用すると、このキャッシュ関連のヘルスメトリクスを有効にできます。

スループットが集約された帯域幅制限を超えたためにドロップされたネットワークパケット。これは、キャッシュ設定のボトルネックを診断するのに役立ちます。データは、appsyncCacheNetworkBandwidthOutAllowanceExceeded メトリクスで API_Id を指定することで、特定の API に記録されます。

単位: カウント ID で指定された API の帯域幅制限を超えた後にドロップされたパケットの数。

EngineCPUUtilization

注記

Redis OSS プロセスに割り当てられた CPU 使用率 (パーセンテージ)。これは、キャッシュ設定のボトルネックを診断するのに役立ちます。データは、appsyncCacheEngineCPUUtilization メトリクスで API_Id を指定することで、特定の API に記録されます。

単位: パーセント。ID で指定された API の Redis OSS プロセスで現在使用されている CPU の割合。

リアルタイムサブスクリプション

すべてのメトリクスは、GraphQLAPIId という 1 つのディメンションで出力されます。これは、すべてのメトリクスが GraphQL API ID と結合されていることを意味します。次のメトリクスは、純粋な WebSocket を介した GrapQL サブスクリプションに関連しています。

ConnectRequests

成功した試行と失敗した試行の両方を含む AWS AppSync、に対して行われた WebSocket 接続リクエストの数。

単位: カウント接続リクエストの総数を取得するために Sum 統計を使用します。

ConnectSuccess

AWS AppSync への成功した WebSocket 接続の数。サブスクリプションなしで接続することは可能です。

単位: カウント成功した接続の出現総数を取得するために、Sum 統計を使用します。

ConnectClientError

クライアント側のエラーにより AWS AppSync によって拒否された WebSocket 接続の数。これは、サービスがスロットリングされているか、承認設定が正しく構成されていないことを意味する可能性があります。

単位: カウントクライアント側の接続エラーの出現総数を取得するために、Sum 統計を使用します。

ConnectServerError

接続の処理中に AWS AppSync から発生したエラーの数。これは通常、予期しないサーバー側の問題が発生した場合に発生します。

単位: カウントサーバー側の接続エラーの出現総数を取得するために、Sum 統計を使用します。

DisconnectSuccess

AWS AppSync から正常に切断された WebSocket の数。

単位: カウント成功した切断の出現総数を取得するために、Sum 統計を使用します。

DisconnectClientError

WebSocket 接続の切断中に AWS AppSync から発生したクライアントエラーの数。

単位: カウント切断エラーの出現総数を取得するために、Sum 統計を使用します。

DisconnectServerError

WebSocket 接続の切断中に AWS AppSync から発生したサーバーエラーの数。

単位: カウント切断エラーの出現総数を取得するために、Sum 統計を使用します。

SubscribeSuccess

WebSocket を介して AWS AppSync に正常に登録されたサブスクリプションの数。サブスクリプションがなくても接続することはできますが、接続せずにサブスクリプションを持つことはできません。

単位: カウント成功したサブスクリプションの出現総数を取得するために、Sum 統計を使用します。

SubscribeClientError

クライアント側のエラーにより AWS AppSync によって拒否されたサブスクリプションの数。これは、JSON ペイロードが正しくない、サービスがスロットリングされている、または承認設定が正しく構成されていない場合に発生する可能性があります。

単位: カウントクライアント側のサブスクリプションエラーの出現総数を取得するために、Sum 統計を使用します。

SubscribeServerError

サブスクリプションの処理中に AWS AppSync から発生したエラーの数。これは通常、予期しないサーバー側の問題が発生した場合に発生します。

単位: カウントサーバー側のサブスクリプションエラーの出現総数を取得するために、Sum 統計を使用します。

UnsubscribeSuccess

正常に処理されたサブスクリプション解除リクエストの数。

単位: カウント成功したサブスクリプション解除リクエストの出現総数を取得するために、Sum 統計を使用します。

UnsubscribeClientError

クライアント側のエラーにより AWS AppSync によって拒否されたサブスクリプション解除リクエストの数。

単位: カウントクライアント側のサブスクリプション解除リクエストのエラーの出現総数を取得するために、Sum 統計を使用します。

UnsubscribeServerError

サブスクリプション解除リクエストの処理中に AWS AppSync から発生したエラーの数。これは通常、予期しないサーバー側の問題が発生した場合に発生します。

単位: カウントサーバー側のサブスクリプション解除リクエストのエラーの出現総数を取得するために、Sum 統計を使用します。

PublishDataMessageSuccess

正常に発行されたサブスクリプションイベントメッセージの数。

単位: カウント正常に発行されたサブスクリプションイベントメッセージの合計を取得するために、Sum 統計を使用します。

PublishDataMessageClientError

クライアント側のエラーのために発行に失敗したサブスクリプションイベントメッセージの数。

Unit: カウント クライアント側のサブスクリプションイベント発行エラーの出現総数を取得するために、Sum 統計を使用します。

PublishDataMessageServerError

サブスクリプションイベントメッセージの発行中に AWS AppSync から発生したエラーの数。これは通常、予期しないサーバー側の問題が発生した場合に発生します。

単位: カウントサーバー側のサブスクリプションイベント発行エラーの出現総数を取得するために、Sum 統計を使用します。

PublishDataMessageSize

発行されたサブスクリプションイベントメッセージのサイズ。

単位: バイト

ActiveConnections

サブスクリプションイベントメッセージの発行中に発生した AWS AppSync からのエラーの数。

単位: カウント開かれている接続の合計数を取得するために、Sum 統計を使用します。

ActiveSubscriptions

クライアントからの同時サブスクリプション数 (1 分間)。

単位: カウントアクティブなサブスクリプションの合計数を取得するために、Sum 統計を使用します。

ConnectionDuration

接続が開いたままになる時間。

単位: ミリ秒 接続期間を評価するために Average 統計を使用します。

OutboundMessages

正常に公開された従量制メッセージの数。1 つの従量制メッセージは 5 kB の配信済みデータに相当します。

単位: カウント正常に公開された従量制メッセージの総数を取得するために、Sum 統計を使用します。

InboundMessageSuccess

正常に処理されたインバウンドメッセージの数。ミューテーションによって呼び出されるサブスクリプションタイプごとに 1 つのインバウンドメッセージが生成されます。

単位: カウント正常に処理されたインバウンドメッセージの総数を取得するために、Sum 統計を使用します。

InboundMessageError

サブスクリプションのペイロードサイズの制限である 240 kB を超えるなど、無効な API リクエストが原因で処理に失敗したインバウンドメッセージの数。

単位: カウント API 関連で処理に失敗したインバウンドメッセージの総数を取得するために、Sum 統計を使用します。

InboundMessageFailure

エラーが原因で処理に失敗したインバウンドメッセージの数 AWS AppSync。

単位: カウント Sum 統計を使用して、 AWS AppSync関連する処理エラーが発生したインバウンドメッセージの合計数を取得します。

InboundMessageDelayed

遅延インバウンドメッセージの数。インバウンドメッセージレートのクォータまたはアウトバウンドメッセージレートのクォータのいずれかが超過すると、インバウンドメッセージが遅延する可能性があります。

単位: カウント合計の統計を使用して、遅延したインバウンドメッセージの総数を取得します。

InboundMessageDropped

ドロップされたインバウンドメッセージの数。インバウンドメッセージは、インバウンドメッセージレートのクォータまたはアウトバウンドメッセージレートのクォータのいずれかを超えた場合にドロップする可能性があります。

単位: カウント合計の統計を使用して、ドロップされたインバウンドメッセージの総数を取得します。

InvalidationSuccess

$extensions.invalidateSubscriptions() とのミューテーションによって正常に無効 (購読解除) されたサブスクリプションの数。

単位: カウントサブスクライブが正常に解除されたサブスクリプションの総数を取得するには Sum 統計を使用します。

InvalidationRequestSuccess

正常に処理された無効化リクエストの数。

単位: カウント正常に処理された無効化リクエストの総数を取得するために、Sum 統計を使用します。

InvalidationRequestError

無効な API リクエストにより処理に失敗した無効化リクエストの数。

単位: カウント API 関連で処理に失敗した無効化リクエストの総数を取得するために、Sum 統計を使用します。

InvalidationRequestFailure

エラーにより処理に失敗した無効化リクエストの数 AWS AppSync。

単位: カウント Sum 統計を使用して、 AWS AppSync関連する処理エラーのある無効化リクエストの合計数を取得します。

InvalidationRequestDropped

無効化リクエストのクォータを超えたときにドロップされた無効化リクエストの数。

単位: カウントドロップされた無効化リクエストの総数を取得するために、Sum 統計を使用します。

インバウンドメッセージとアウトバウンドメッセージの比較

ミューテーションを実行すると、そのミューテーションの @aws_subscribe ディレクティブを含むサブスクリプションフィールドが呼び出されます。サブスクリプションを呼び出すたびに、1 つのインバウンドメッセージが生成されます。例えば、2 つのサブスクリプションフィールドが @aws_subscribe で同じミューテーションを指定している場合、そのミューテーションが呼び出されると 2 つのインバウンドメッセージが生成されます。

1 つのアウトバウンドメッセージは、WebSocket クライアントに配信される 5 kB のデータに相当します。例えば、15 kB のデータを 10 個のクライアントに送信すると、アウトバウンドメッセージは 30 件になります (15 kB × 10 クライアント ÷ 1 メッセージあたり 5 kB = 30 メッセージ)。

インバウンドメッセージまたはアウトバウンドメッセージのクォータ引き上げをリクエストできます。詳細については、「AWS 参考文献」の「AWS AppSync エンドポイントとクォータ」、「Service Quotas クォータユーザーガイド」の「クォータ増加のリクエスト」の手順を参照してください。

拡張メトリクス

拡張メトリクスは、 AWS AppSync リクエスト数やエラー数、レイテンシー、キャッシュヒット/ミスなど、API の使用状況とパフォーマンスに関する詳細なデータを生成します。拡張メトリクスデータはすべて CloudWatch アカウントに送信され、送信されるデータのタイプを設定できます。

注記

拡張メトリクスを使用する場合、追加料金が適用されます。詳細については、「Amazon CloudWatch の料金」の「詳細モニタリング」の料金レベルを参照してください。

これらのメトリクスは、 AWS AppSync コンソールのさまざまな設定ページで確認できます。API 設定ページで、拡張メトリクスセクションを使用すると、次の項目を有効または無効にできます。

リゾルバーメトリクスの動作: これらのオプションは、リゾルバーの追加メトリクスの収集方法を制御します。フルリクエストリゾルバーメトリクス (リクエスト内のすべてのリゾルバーに対して有効になっているメトリクス) またはリゾルバーごとのメトリクス (設定が有効になっているリゾルバーに対してのみ有効になっているメトリクス) を有効にすることができます。以下のオプションが利用できます。

GraphQL errors per resolver (GraphQLError)

リゾルバーごとに発生した GraphQL エラーの数。