ガイドラインとクォータ - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ガイドラインとクォータ

別に指定されていない限り、Amazon Comprehend のクォータは地域ごとに設定されます。アプリケーションに必要な場合は、調整可能なクォータの引き上げをリクエストできます。クォータの詳細およびクォータ増加リクエストについては、「AWS Service Quotas」を参照してください。

サポートされるリージョン

Amazon Comprehend AWS は以下のリージョンでご利用いただけます。

  • 米国東部 (オハイオ)

  • 米国東部 (バージニア北部)

  • 米国西部 (オレゴン)

  • アジアパシフィック (ムンバイ)

  • アジアパシフィック (ソウル)

  • アジアパシフィック (シンガポール)

  • アジアパシフィック (シドニー)

  • アジアパシフィック (東京)

  • カナダ (中部)

  • 欧州 (フランクフルト)

  • 欧州 (アイルランド)

  • 欧州 (ロンドン)

  • AWS GovCloud (米国西部)

デフォルトで、Amazon Comprehend はサポートされている各地域ですべての API オペレーションを提供します。例外については、「ドキュメント処理」を参照してください。

API ンドポイントの詳細については、「Amazon Web Services 全般リファレンス」の「Amazon Comprehend リージョンとエンドポイント」を参照してください。

地域の現在のクォータを確認したり、調整可能なクォータの引き上げをリクエストするには、「Service Quotas コンソール」 を開いてください。

組み込みモデルのクォータ

Amazon Comprehend には、UTF-8 テキストドキュメントを分析するための組み込みモデルが用意されています。Amazon Comprehend には、組み込みモデルを使用する同期操作と非同期操作が用意されています。

リアルタイム (同期) 分析

このセクションでは、組み込みモデルを使用したリアルタイム分析に関するクォータについて説明します。

単一ドキュメント操作

Amazon Comprehend API には、1 つのドキュメントを入力して受け取るオペレーションが用意されています。これらのオペレーションには、以下のクォータが適用されます。

単一ドキュメント操作の一般的なクォータ

エンティティ、キーフレーズ、または主要言語を検出するためのリアルタイム分析には、以下のクォータが適用されます。エンティティ検出の場合、これらのクォータは組み込みモデルによる検出に適用されます。カスタムエンティティ検出については、「カスタムエンティティ認識 」のクォータを参照してください。

説明 クォータ/ガイドライン
最大ドキュメントサイズ  100 KB
1 つのドキュメント操作に対する操作固有のクォータ

センチメント、ターゲット感情、構文を検出するためのリアルタイム分析には、以下のクォータが適用されます。

説明 クォータ/ガイドライン
最大ドキュメントサイズ  5 KB

複数のドキュメント操作

Amazon Comprehend API は、1 回の API リクエストで複数のドキュメントを処理するバッチオペレーションを提供します。  バッチオペレーションには、以下のクォータが適用されます。

説明 クォータ/ガイドライン
最大ドキュメントサイズ  5 KB
1 回のリクエストあたりの最大ドキュメント数  25

バッチドキュメントオペレーションの詳細については、複数ドキュメントの同期処理 を参照してください。

リアルタイム (同期) リクエストのリクエストスロットリング

Amazon Comprehend は同期リクエストに動的スロットリングを適用します。  システム処理帯域幅が利用可能な場合、Amazon Comprehend は処理するリクエストの数を徐々に増やします。アプリケーションによる同期 API オペレーションの使用を制御するには、請求アラートをオンにするか、アプリケーションにレート制限を実装することをお勧めします。

非同期分析

このセクションでは、組み込みモデルを使用した非同期分析に関連するクォータについて説明します。 

非同期 API オペレーションは、それぞれ最大 10 個のアクティブジョブをサポートします。  各 API オペレーションのクォータを確認するには、「Amazon Web Services 全般リファレンス」の「 Amazon Comprehend エンドポイントとクオータ」の「Service Quotas」テーブルを参照してください。

調整可能なクォータの場合、Service Quotas コンソールを使用してクォータの引き上げをリクエストできます。

非同期オペレーションの一般的なクォータ 

非同期分析ジョブは、コンソールまたは任意の API Start* オペレーションを使用して実行できます。非同期オペレーションの使用タイミングについては、「非同期バッチ処理」を参照してください。以下のクォータは、組み込みモデルのほとんどの API Start* オペレーションに適用されます。例外については、「非同期ジョブの操作固有クォータ 」を参照してください。

説明 クォータ/ガイドライン
エンティティ、キーフレーズ、PII、言語を検出するジョブ内の各ドキュメントの最大サイズ 1 MB
リクエスト内のすべてのファイルの最大合計サイズ 5 GB
リクエスト内のすべてのファイルの最小合計サイズ 500 バイト
最大ファイル数 (1 ファイルあたり 1 ドキュメント) 1,000,000
最大合計行数 (1 行につき 1 ドキュメント) 1,000,000

非同期ジョブの操作固有クォータ 

このセクションでは、特定の非同期操作のクォータについて説明します。  以下の表にクォータが指定されていない場合は、一般的なクォータ値が適用されます。 

感情

このオペレーションで作成する非同期センチメントジョブには、以下のクォータがあります。StartSentimentDetectionJob

説明 クォータ/ガイドライン
各入力ドキュメントの最大サイズ 5 KB
ターゲット感情

オペレーションで作成する非同期ターゲットセンチメントジョブには、以下のクォータがあります。StartTargetedSentimentDetectionJob

説明 クォータ/ガイドライン
サポートされるドキュメント形式 UTF-8
1 つのジョブ内の各入力ドキュメントの最大サイズ 10 KB
1 つのジョブ内の全ドキュメントの最大サイズ 300 MB
最大ファイル数 (1 ファイルあたり 1 ドキュメント) 30,000
最大合計行数、1 行につき 1 つのドキュメント (1 件のリクエストに含まれる全ファイル) 30,000
イベント

このオペレーションで作成する非同期イベント検出ジョブには、以下のクォータがあります。StartEventsDetectionJob

説明 クォータ
文字エンコーディング UTF-8
1 つのジョブ内のすべてのファイルの合計サイズ 50 MB
1 つのジョブ内の各入力ドキュメントの最大サイズ 10 KB
最大ファイル数 (1 ファイルあたり 1 ドキュメント) 5,000
最大合計行数、1 行につき 1 つのドキュメント (リクエストに含まれる全ファイル) 5,000
トピックのモデリング

StartTopicsDetectionJobオペレーションで作成する非同期トピックモデリングジョブには、以下のクォータがあります。

説明 クォータ/ガイドライン
文字エンコーディング UTF-8
返されるトピックの最大数 100
1 ファイルの最大ファイルサイズ、1 ファイルにつき 1 ドキュメント  100 MB

詳細については、「トピックのモデリング」を参照してください。

非同期リクエストのリクエストスロットリング 

各非同期 API オペレーションは、1 秒あたりの最大リクエスト数 (リージョンごと、アカウントごと) と、最大 10 件のアクティブジョブをサポートします。  各 API オペレーションのクォータを確認するには、「Amazon Web Services 全般リファレンス」の「 Amazon Comprehend エンドポイントとクオータ」の「Service Quotas」テーブルを参照してください。

調整可能なクォータの場合、Service Quotas コンソールを使用してクォータの引き上げをリクエストできます。

カスタムモデルのクォータ 

Amazon Comprehend では、カスタム分類とカスタムエンティティ認識のための独自のカスタムモデルを構築することができます。このセクションでは、カスタムモデルのトレーニングと使用に関するガイドラインとクォータについて説明します。  カスタムモデルの詳細については、「Amazon Comprehend Custom」を参照してください。

一般的なクォータ

Amazon Comprehend は、カスタムモデルで分析できる入力ドキュメントの種類ごとに一般的なサイズ割り当てを設定します。リアルタイム分析のクォータについては、「リアルタイム分析用の最大ドキュメントサイズ 」 を参照してください。非同期分析クォータについては、「非同期カスタム分析の入力 」 を参照してください。

各非同期 API オペレーションは、1 秒あたりの最大リクエスト数 (リージョンごと、アカウントごと) と、最大 10 件のアクティブジョブをサポートします。  各 API オペレーションのクォータを確認するには、「Amazon Web Services 全般リファレンス」の「 Amazon Comprehend エンドポイントとクオータ」の「Service Quotas」テーブルを参照してください。

調整可能なクォータの場合、Service Quotas コンソールを使用してクォータの引き上げをリクエストできます。

エンドポイントのクォータ

エンドポイントを作成して、カスタムモデルでリアルタイム分析を実行します。  エンドポイントの詳細については、Amazon Comprehend のエンドポイントの管理 を参照してください。

次のクォータがエンドポイントに適用されます。クォータ増加リクエストの詳細については、「AWS Service Quotas」を参照してください。

説明 クォータ/ガイドライン
各アカウントのリージョンあたりのアクティブなエンドポイントの最大数  20
各アカウントのリージョンあたりの推論単位の最大数 200
1 リージョン 1 エンドポイントごとの最大推論単位数 50
推論単位あたりの最大スループット (文字) 100/秒
推論単位あたりの最大スループット (ドキュメント) 2/秒

ドキュメント分類

このセクションでは、以下のドキュメント分類操作のガイドラインとクォータについて説明します。

ドキュメント分類の一般的なクォータ

次の表では、カスタム分類子のトレーニングに関連する一般的なクォータについて説明しています。

説明 クォータ/ガイドライン
クラス名の最大長 5,000 文字
クラス数 (複数クラスモード) 2~1,000
クラス数 (複数ラベルモード) 2~100
注釈の形式
クラスあたりの注釈の最小数 (複数クラスモード) 10
クラスあたりの注釈の最小数 (複数ラベルモード)  10
注釈の最小数 (複数ラベルモード)  50
CSV ファイル形式
クラスあたりのトレーニングドキュメントの最小数 (複数クラスモード)  50
クラスあたりのトレーニングドキュメントの最小数 (複数ラベルモード) 10
トレーニングドキュメントの最小数 (複数ラベルモード) 50

プレーンテキストドキュメントの分類

プレーンテキスト入力ドキュメントを使用してプレーンテキストモデルを作成し、トレーニングします。Amazon Comprehend には、プレーンテキストモデルを使用してプレーンテキストドキュメントを分類するためのリアルタイム操作と非同期操作が用意されています。

トレーニング

次の表では、プレーンテキストドキュメントを使用したカスタム分類子のトレーニングに関連するクォータについて説明しています。 

説明 クォータ/ガイドライン
1 つのトレーニングジョブ内の全ファイルの合計サイズ 5 GB
カスタム分類子をトレーニングするための拡張マニフェストファイルの最大数 5
各拡張マニフェストファイルの属性名の最大数  5
属性名の最大長 63 文字
リアルタイム (同期) 分析

次の表では、プレーンテキストドキュメントのリアルタイム分類に関連するクォータについて説明しています。 

説明 クォータ/ガイドライン
同期リクエスト 1 回あたりの最大ドキュメント数 1
最大テキストドキュメントサイズ (UTF-8 エンコード) 10 KB
非同期分析

次の表では、プレーンテキストドキュメントの非同期分類に関連するクォータについて説明しています。 

説明 クォータ/ガイドライン
1 つの非同期ジョブ内の全ファイルの合計サイズ 5 GB
1 ファイルの最大ファイルサイズ、1 ファイルにつき 1 ドキュメント  10 MB
最大ファイル数 (1 ファイルあたり 1 ドキュメント) 1,000,000
最大合計行数、1 行につき 1 つのドキュメント (リクエストに含まれる全ファイル) 1,000,000

半構造化ドキュメントの分類

このセクションでは、半構造化ドキュメントのドキュメント分類に関するガイドラインとクォータについて説明します。半構造化ドキュメントを分類するには、ネイティブ入力ドキュメントでトレーニングしたネイティブドキュメントモデルを使用してください。

半構造化ドキュメントによるネイティブドキュメントモデルのトレーニング

次の表は、PDF ドキュメント、Word ドキュメント、画像ファイルなどの半構造化ドキュメントによるカスタム分類子のトレーニングに関連するクォータを示しています。

説明 クォータ/ガイドライン
全ドキュメントの最大ページ数 10,000
注釈ファイルの最大サイズ (全 CSV ファイルサイズを合わせたサイズ) 5 MB
ドキュメントコーパスサイズ (トレーニングドキュメントとテストドキュメント) 10 GB
トレーニングファイルとテストファイルのファイルサイズ
画像ファイルサイズ (JPG、PNG、TIFF)。  1 バイト~10 MB。

TIFF ファイル:最大 1 ページ。

PDF ドキュメントのページサイズ 1 バイト~10 MB
Word ドキュメントのページサイズ 1 バイト~10 MB
Amazon Textract API 出力 JSON サイズ 1 バイト~1 MB
リアルタイム (同期) 分析

このセクションでは、半構造化ドキュメントのリアルタイム分類に関するクォータについて説明します。

次の表は、入力ドキュメントの最大ファイルサイズを示しています。すべての入力ドキュメントタイプで、入力ファイルの最大数は 1 ページで、10,000 文字以下です。

ファイルタイプ 最大サイズ (API) 最大サイズ (コンソール)
A UTF-8 テキストドキュメント 10 KB 10 KB
PDF ドキュメント 10 MB 5 MB
Word ドキュメント 10 MB 5 MB
画像ファイル 10 MB 5 MB
Amazon Textract API 出力サイズ 1 MB 該当なし
非同期分析

次の表では、半構造化ドキュメントの非同期分類に関連するクォータについて説明しています。

説明 クォータ/ガイドライン
ジョブのすべての入力ドキュメントの最大ページ数 25,000
ドキュメントコーパスサイズ 25 GB
画像ファイルサイズ (JPG、PNG、TIFF)  1 バイト~10 MB。

TIFF ファイル:最大 1 ページ。

PDF ドキュメントのページサイズ 1 バイト~10 MB
Word ドキュメントのページサイズ 1 バイト~10 MB
Textract API 出力 JSON サイズ 1 バイト~1 MB。

カスタムエンティティ認識

このセクションでは、カスタムエンティティレコグナイザーの以下の操作に関するガイドラインとクォータについて説明します。

  • CreateEntityRecognizerエンティティ認識トレーニングジョブは操作から開始されました。

  • 非同期エンティティ認識ジョブは操作から開始されました。StartEntitiesDetectionJob

  • オペレーションを使用した同期エンティティ認識リクエスト。DetectEntities

プレーンテキストドキュメントのカスタムエンティティレコグナイザー

Amazon Comprehend には、カスタムエンティティレコグナイザーを使用してプレーンテキストドキュメントを分析するための非同期操作と同期操作が用意されています。

トレーニング

このセクションでは、プレーンテキストドキュメントを分析するためのカスタムエンティティレコグナイザーのトレーニングに関連するクォータについて説明します。モデルをトレーニングするには、エンティティリストまたは注釈付きテキストドキュメントのセットを提供できます。

次の表では、エンティティリストを使用したモデルのトレーニングに関連するクォータについて説明しています。

説明 クォータ/ガイドライン
1 モデルあたりのエンティティ数 1~25
ドキュメントサイズ (UTF-8) 1~5,000 バイト
エンティティリスト内の項目数 1~100 万
エントリリスト内の個々のエントリ (ポストストリップ) の長さ 1~5,000
エンティティリストのコーパスサイズ (プレーンテキストの全ドキュメントを含む) 5 KB~200 MB

次の表では、注釈付きテキストドキュメント使用したモデルのトレーニングに関連するクォータについて説明しています。

説明 クォータ/ガイドライン
モデル/カスタムエンティティレコグナイザーあたりのエンティティ数 1~25
ドキュメントサイズ (UTF-8) 1~5,000 バイト
ドキュメント数 (「プレーンテキスト注釈」 を参照) 3~200,000
ドキュメントコーパスサイズ (プレーンテキストの全ドキュメントを含む) 5 KB~200 MB
エンティティごとの最小注釈数 25
リアルタイム (同期) 分析

次の表では、プレーンテキストドキュメントのリアルタイム分析に関連するクォータについて説明しています。 

説明 クォータ/ガイドライン
同期リクエスト 1 回あたりの最大ドキュメント数 1
最大テキストドキュメントサイズ (UTF-8 エンコード) 5 KB
非同期分析

次の表では、プレーンテキストドキュメントの非同期エンティティレコグナイザーに関連するクォータについて説明しています。

説明 クォータ/ガイドライン
ドキュメントサイズ (UTF-8) 1 バイト~1 MB
最大ファイル数 (1 ファイルあたり 1 ドキュメント) 1,000,000
最大合計行数、1 行につき 1 つのドキュメント (リクエストに含まれる全ファイル) 1,000,000
ドキュメントコーパスサイズ (プレーンテキストの全ドキュメントを含む) 1 バイト~5 GB

半構造化ドキュメントのカスタムエンティティレコグナイザー

Amazon Comprehend には、カスタムエンティティレコグナイザーを使用して半構造化ドキュメントを分析するための非同期操作と同期操作が用意されています。注釈付き PDF ドキュメントを使用してモデルをトレーニングする必要があります。

トレーニング

次の表は、半構造化文書を分析するためのカスタム・エンティティ・レコグナイザー (CreateEntityRecognizer) のトレーニングに関連するクォータを示しています。

説明 クォータ/ガイドライン
モデル/カスタムエンティティレコグナイザーあたりのエンティティ数 1~25
最大注釈ファイルサイズ (UTF-8 JSON) 5 MB
ドキュメント数 250~10,000
ドキュメントコーパスサイズ (プレーンテキストの全ドキュメントを含む) 5 KB~1 GB
エンティティごとの最小注釈数 100
カスタムエンティティレコグナイザーをトレーニングするための拡張マニフェストファイルの最大数 5
各拡張マニフェストファイルの属性名の最大数  5
属性名の最大長 63 文字
リアルタイム (同期) 分析

このセクションでは、半構造化ドキュメントのリアルタイム分析に関するクォータについて説明します。

次の表は、入力ドキュメントの最大ファイルサイズを示しています。すべての入力ドキュメントタイプで、入力ファイルの最大数は 1 ページで、10,000 文字以下です。

ファイルタイプ 最大サイズ (API) 最大サイズ (コンソール)
A UTF-8 テキストドキュメント 10 KB 10 KB
PDF ドキュメント 10 MB 5 MB
Word ドキュメント 10 MB 5 MB
画像ファイル 10 MB 5 MB
Textract 出力ファイル 1 MB 該当なし
非同期分析

このセクションでは、半構造化ドキュメントの非同期分析のクォータについて説明します。

説明 クォータ/ガイドライン
画像サイズ (JPG または PNG) 1 バイト~10 MB
画像サイズ (TIFF) 1 バイト~10 MB。最大 1 ページ。
ドキュメントサイズ (PDF) 1 バイト~50 MB
ドキュメントサイズ (Docx) 1 バイト~5 MB
ドキュメントサイズ (UTF-8) 1 バイト~1 MB
最大ファイル数、1 ファイルあたり 1 ドキュメント (画像ファイルや PDF/Word ドキュメントでは 1 行に 1 つのドキュメントは使用できません) 500
PDF または Docx ファイルの最大ページ数  100
テキスト抽出後のドキュメントコーパスサイズ (プレーンテキスト、すべてのファイルを含む) 1 バイト~5 GB

画像の制限の詳細については、「Amazon Textract のハードリミット」 を参照してください。

フライホイールのクォータ

フライホイールを使用して、カスタム分類とカスタムエンティティレコグナイザーのためのカスタムモデルバージョンのトレーニングと追跡を管理します。フライホイールの詳細については、「フライホイール」を参照してください。

フライホイールの一般的なクォータ

フライホイールとフライホイールイテレーションには以下のクォータが適用されます。

説明 クォータ/ガイドライン
フライホイールの最大数 50
「CREATING」(作成中) 状態のフライホイールの最大数 10
フライホイールあたりのトレーニングデータセットの最大数 50
フライホイールあたりのテストデータセットの最大数 50
「インジェスト中」 状態のデータセットの最大数 10
アカウントごとの進行中のフライホイールイテレーションの最大数 10

カスタム分類モデルのデータセットクォータ

カスタム分類モデルに関連するフライホイールにデータセットを取り込むと、次のクォータが適用されます。

説明 クォータ/ガイドライン
クラスあたりのトレーニングドキュメントの最小数 (複数ラベルモード) 50
トレーニングドキュメントの最大数 1,000,000
最小データセットサイズ 500 バイト
最大データセットサイズ 5 GB
1 ファイルの最大ファイルサイズ、1 ファイルにつき 1 ドキュメント  10 MB

カスタムエンティティレコグナイザーモデルのデータセットクォータ

カスタムエンティティレコグナイザーモデルに関連するフライホイールのデータセットを取り込むと、次のクォータが適用されます。

説明 クォータ/ガイドライン
最大ドキュメントサイズ  5 KB
トレーニングドキュメントの最小数 3
トレーニングドキュメントの最大数 200,000 件の
エンティティごとの最小注釈数 25
最大データセットサイズ 200 MB