翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Amazon Comprehend エンドポイントのモニタリング
推論単位 (IUsの数を増減することで、エンドポイントのスループットを調整できます。エンドポイントの更新の詳細については、「Amazon Comprehend のエンドポイントの更新」を参照してください。
Amazon CloudWatch コンソールで使用状況を監視することで、エンドポイントのスループットを最適に調整する方法を決定できます。
でエンドポイントの使用状況を監視する CloudWatch
-
にサインイン AWS Management Console し、 CloudWatch コンソール
を開きます。 -
左の [指標] を選択し、次に [すべての指標] を選択します。
-
[すべての指標] で [理解] を選択します。
-
CloudWatch コンソールには、Comprehend メトリクスのディメンションが表示されます。EndpointArn ディメンションを選択します。
コンソールにはProvisionedInferenceUnits、エンドポイントInferenceUtilizationごとに RequestedInferenceUnits、ConsumedInferenceUnits、、および が表示されます。
4 つのメトリクスを選択し、グラフ化されたメトリクスタブに移動します。
-
RequestedInferenceUnits および の統計列ConsumedInferenceUnitsを Sum に設定します。
-
の統計列を SumInferenceUtilization に設定します。
-
の統計列ProvisionedInferenceUnitsを Average に設定します。
-
すべての指標の期間列を 1 分に変更します。
-
矢印を選択してInferenceUtilization選択し、別の Y TAK に移動します。
これでグラフは分析できる状態になりました。
CloudWatch メトリクスに基づいて、エンドポイントのスループットを自動的に調整するように自動スケーリングを設定することもできます。エンドポイントを使用した自動スケーリングの使用に関する詳細については、「自動スケーリングとエンドポイント」を参照してください。
-
ProvisionedInferenceUnits - このメトリクスは、リクエストが行われた時点のプロビジョニング済み IUs の平均数を表します。
-
RequestedInferenceUnits - これは、処理のために送信されたサービスに送信された各リクエストの使用状況に基づいています。これは、送信されたリクエストを、スロットリングなしで実際に処理されたリクエスト () と比較するのに役立ちますConsumedInferenceUnits。このメトリクスの値は、処理するために送信される文字数を 1 分間に処理できる文字数で割って計算されます。
-
ConsumedInferenceUnits - これは、正常に処理された (スロットリングされていない) サービスに送信された各リクエストの使用状況に基づいています。これは、消費しているものを準備された IU と比較するときに便利です。この指標の値は、処理された文字数を 1 IU の 1 分間に処理できる文字数で割って計算されます。
-
InferenceUtilization - これはリクエストごとに発行されます。この値は、 で定義されている消費された IUsを取得しConsumedInferenceUnits、 で除算ProvisionedInferenceUnitsして 100 のパーセンテージに変換することによって計算されます。
注記
すべての指標は、リクエストが成功した場合にのみ出力されます。スロットリングされたリクエスト、内部サーバーエラーや顧客エラーにより失敗したリクエストからの指標は表示されません。