翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ガイドラインとクォータ
別に指定されていない限り、Amazon Comprehend のクォータは地域ごとに設定されます。アプリケーションに必要な場合は、調整可能なクォータの引き上げをリクエストできます。クォータの詳細およびクォータ増加リクエストについては、「AWS Service Quotas」を参照してください。
サポートされるリージョン
Amazon Comprehend AWS は以下のリージョンでご利用いただけます。
-
米国東部 (オハイオ)
-
米国東部 (バージニア北部)
-
米国西部 (オレゴン)
-
アジアパシフィック (ムンバイ)
-
アジアパシフィック (ソウル)
-
アジアパシフィック (シンガポール)
-
アジアパシフィック (シドニー)
-
アジアパシフィック (東京)
-
カナダ (中部)
-
欧州 (フランクフルト)
-
欧州 (アイルランド)
-
欧州 (ロンドン)
-
AWS GovCloud (米国西部)
デフォルトで、Amazon Comprehend はサポートされている各地域ですべての API オペレーションを提供します。例外については、「ドキュメント処理」を参照してください。
API ンドポイントの詳細については、「Amazon Web Services 全般リファレンス」の「Amazon Comprehend リージョンとエンドポイント」を参照してください。
地域の現在のクォータを確認したり、調整可能なクォータの引き上げをリクエストするには、「Service Quotas コンソール」
組み込みモデルのクォータ
Amazon Comprehend には、UTF-8 テキストドキュメントを分析するための組み込みモデルが用意されています。Amazon Comprehend には、組み込みモデルを使用する同期操作と非同期操作が用意されています。
リアルタイム (同期) 分析
このセクションでは、組み込みモデルを使用したリアルタイム分析に関するクォータについて説明します。
単一ドキュメント操作
Amazon Comprehend API には、1 つのドキュメントを入力して受け取るオペレーションが用意されています。これらのオペレーションには、以下のクォータが適用されます。
単一ドキュメント操作の一般的なクォータ
エンティティ、キーフレーズ、または主要言語を検出するためのリアルタイム分析には、以下のクォータが適用されます。エンティティ検出の場合、これらのクォータは組み込みモデルによる検出に適用されます。カスタムエンティティ検出については、「カスタムエンティティ認識 」のクォータを参照してください。
説明 | クォータ/ガイドライン |
---|---|
最大ドキュメントサイズ | 100 KB |
1 つのドキュメント操作に対する操作固有のクォータ
センチメント、ターゲット感情、構文を検出するためのリアルタイム分析には、以下のクォータが適用されます。
説明 | クォータ/ガイドライン |
---|---|
最大ドキュメントサイズ | 5 KB |
複数のドキュメント操作
Amazon Comprehend API は、1 回の API リクエストで複数のドキュメントを処理するバッチオペレーションを提供します。 バッチオペレーションには、以下のクォータが適用されます。
説明 | クォータ/ガイドライン |
---|---|
最大ドキュメントサイズ | 5 KB |
1 回のリクエストあたりの最大ドキュメント数 | 25 |
バッチドキュメントオペレーションの詳細については、複数ドキュメントの同期処理 を参照してください。
リアルタイム (同期) リクエストのリクエストスロットリング
Amazon Comprehend は同期リクエストに動的スロットリングを適用します。 システム処理帯域幅が利用可能な場合、Amazon Comprehend は処理するリクエストの数を徐々に増やします。アプリケーションによる同期 API オペレーションの使用を制御するには、請求アラートをオンにするか、アプリケーションにレート制限を実装することをお勧めします。
非同期分析
このセクションでは、組み込みモデルを使用した非同期分析に関連するクォータについて説明します。
非同期 API オペレーションは、それぞれ最大 10 個のアクティブジョブをサポートします。 各 API オペレーションのクォータを確認するには、「Amazon Web Services 全般リファレンス」の「 Amazon Comprehend エンドポイントとクオータ」の「Service Quotas」テーブルを参照してください。
調整可能なクォータの場合、Service Quotas コンソール
非同期オペレーションの一般的なクォータ
非同期分析ジョブは、コンソールまたは任意の API Start*
オペレーションを使用して実行できます。非同期オペレーションの使用タイミングについては、「非同期バッチ処理」を参照してください。以下のクォータは、組み込みモデルのほとんどの API Start*
オペレーションに適用されます。例外については、「非同期ジョブの操作固有クォータ 」を参照してください。
説明 | クォータ/ガイドライン |
---|---|
エンティティ、キーフレーズ、PII、言語を検出するジョブ内の各ドキュメントの最大サイズ | 1 MB |
リクエスト内のすべてのファイルの最大合計サイズ | 5 GB |
リクエスト内のすべてのファイルの最小合計サイズ | 500 バイト |
最大ファイル数 (1 ファイルあたり 1 ドキュメント) | 1,000,000 |
最大合計行数 (1 行につき 1 ドキュメント) | 1,000,000 |
非同期ジョブの操作固有クォータ
このセクションでは、特定の非同期操作のクォータについて説明します。 以下の表にクォータが指定されていない場合は、一般的なクォータ値が適用されます。
感情
このオペレーションで作成する非同期センチメントジョブには、以下のクォータがあります。StartSentimentDetectionJob
説明 | クォータ/ガイドライン |
---|---|
各入力ドキュメントの最大サイズ | 5 KB |
ターゲット感情
オペレーションで作成する非同期ターゲットセンチメントジョブには、以下のクォータがあります。StartTargetedSentimentDetectionJob
説明 | クォータ/ガイドライン |
---|---|
サポートされるドキュメント形式 | UTF-8 |
1 つのジョブ内の各入力ドキュメントの最大サイズ | 10 KB |
1 つのジョブ内の全ドキュメントの最大サイズ | 300 MB |
最大ファイル数 (1 ファイルあたり 1 ドキュメント) | 30,000 |
最大合計行数、1 行につき 1 つのドキュメント (1 件のリクエストに含まれる全ファイル) | 30,000 |
イベント
このオペレーションで作成する非同期イベント検出ジョブには、以下のクォータがあります。StartEventsDetectionJob
説明 | クォータ |
---|---|
文字エンコーディング | UTF-8 |
1 つのジョブ内のすべてのファイルの合計サイズ | 50 MB |
1 つのジョブ内の各入力ドキュメントの最大サイズ | 10 KB |
最大ファイル数 (1 ファイルあたり 1 ドキュメント) | 5,000 |
最大合計行数、1 行につき 1 つのドキュメント (リクエストに含まれる全ファイル) | 5,000 |
トピックのモデリング
StartTopicsDetectionJobオペレーションで作成する非同期トピックモデリングジョブには、以下のクォータがあります。
説明 | クォータ/ガイドライン |
---|---|
文字エンコーディング | UTF-8 |
返されるトピックの最大数 | 100 |
1 ファイルの最大ファイルサイズ、1 ファイルにつき 1 ドキュメント | 100 MB |
詳細については、「トピックのモデリング」を参照してください。
非同期リクエストのリクエストスロットリング
各非同期 API オペレーションは、1 秒あたりの最大リクエスト数 (リージョンごと、アカウントごと) と、最大 10 件のアクティブジョブをサポートします。 各 API オペレーションのクォータを確認するには、「Amazon Web Services 全般リファレンス」の「 Amazon Comprehend エンドポイントとクオータ」の「Service Quotas」テーブルを参照してください。
調整可能なクォータの場合、Service Quotas コンソール
カスタムモデルのクォータ
Amazon Comprehend では、カスタム分類とカスタムエンティティ認識のための独自のカスタムモデルを構築することができます。このセクションでは、カスタムモデルのトレーニングと使用に関するガイドラインとクォータについて説明します。 カスタムモデルの詳細については、「Amazon Comprehend Custom」を参照してください。
一般的なクォータ
Amazon Comprehend は、カスタムモデルで分析できる入力ドキュメントの種類ごとに一般的なサイズ割り当てを設定します。リアルタイム分析のクォータについては、「リアルタイム分析用の最大ドキュメントサイズ 」 を参照してください。非同期分析クォータについては、「非同期カスタム分析の入力 」 を参照してください。
各非同期 API オペレーションは、1 秒あたりの最大リクエスト数 (リージョンごと、アカウントごと) と、最大 10 件のアクティブジョブをサポートします。 各 API オペレーションのクォータを確認するには、「Amazon Web Services 全般リファレンス」の「 Amazon Comprehend エンドポイントとクオータ」の「Service Quotas」テーブルを参照してください。
調整可能なクォータの場合、Service Quotas コンソール
エンドポイントのクォータ
エンドポイントを作成して、カスタムモデルでリアルタイム分析を実行します。 エンドポイントの詳細については、Amazon Comprehend のエンドポイントの管理 を参照してください。
次のクォータがエンドポイントに適用されます。クォータ増加リクエストの詳細については、「AWS Service Quotas」を参照してください。
説明 | クォータ/ガイドライン |
---|---|
各アカウントのリージョンあたりのアクティブなエンドポイントの最大数 | 20 |
各アカウントのリージョンあたりの推論単位の最大数 | 200 |
1 リージョン 1 エンドポイントごとの最大推論単位数 | 50 |
推論単位あたりの最大スループット (文字) | 100/秒 |
推論単位あたりの最大スループット (ドキュメント) | 2/秒 |
ドキュメント分類
このセクションでは、以下のドキュメント分類操作のガイドラインとクォータについて説明します。
-
オペレーションから開始する分類器トレーニングジョブ。CreateDocumentClassifier
操作から開始する非同期ドキュメント分類ジョブ。StartDocumentClassificationJob
-
オペレーションを使用する同期ドキュメント分類リクエスト。ClassifyDocument
ドキュメント分類の一般的なクォータ
次の表では、カスタム分類子のトレーニングに関連する一般的なクォータについて説明しています。
説明 | クォータ/ガイドライン |
---|---|
クラス名の最大長 | 5,000 文字 |
クラス数 (複数クラスモード) | 2~1,000 |
クラス数 (複数ラベルモード) | 2~100 |
注釈の形式 | |
クラスあたりの注釈の最小数 (複数クラスモード) | 10 |
クラスあたりの注釈の最小数 (複数ラベルモード) | 10 |
注釈の最小数 (複数ラベルモード) | 50 |
CSV ファイル形式 | |
クラスあたりのトレーニングドキュメントの最小数 (複数クラスモード) | 50 |
クラスあたりのトレーニングドキュメントの最小数 (複数ラベルモード) | 10 |
トレーニングドキュメントの最小数 (複数ラベルモード) | 50 |
プレーンテキストドキュメントの分類
プレーンテキスト入力ドキュメントを使用してプレーンテキストモデルを作成し、トレーニングします。Amazon Comprehend には、プレーンテキストモデルを使用してプレーンテキストドキュメントを分類するためのリアルタイム操作と非同期操作が用意されています。
トレーニング
次の表では、プレーンテキストドキュメントを使用したカスタム分類子のトレーニングに関連するクォータについて説明しています。
説明 | クォータ/ガイドライン |
---|---|
1 つのトレーニングジョブ内の全ファイルの合計サイズ | 5 GB |
カスタム分類子をトレーニングするための拡張マニフェストファイルの最大数 | 5 |
各拡張マニフェストファイルの属性名の最大数 | 5 |
属性名の最大長 | 63 文字 |
リアルタイム (同期) 分析
次の表では、プレーンテキストドキュメントのリアルタイム分類に関連するクォータについて説明しています。
説明 | クォータ/ガイドライン |
---|---|
同期リクエスト 1 回あたりの最大ドキュメント数 | 1 |
最大テキストドキュメントサイズ (UTF-8 エンコード) | 10 KB |
非同期分析
次の表では、プレーンテキストドキュメントの非同期分類に関連するクォータについて説明しています。
説明 | クォータ/ガイドライン |
---|---|
1 つの非同期ジョブ内の全ファイルの合計サイズ | 5 GB |
1 ファイルの最大ファイルサイズ、1 ファイルにつき 1 ドキュメント | 10 MB |
最大ファイル数 (1 ファイルあたり 1 ドキュメント) | 1,000,000 |
最大合計行数、1 行につき 1 つのドキュメント (リクエストに含まれる全ファイル) | 1,000,000 |
半構造化ドキュメントの分類
このセクションでは、半構造化ドキュメントのドキュメント分類に関するガイドラインとクォータについて説明します。半構造化ドキュメントを分類するには、ネイティブ入力ドキュメントでトレーニングしたネイティブドキュメントモデルを使用してください。
半構造化ドキュメントによるネイティブドキュメントモデルのトレーニング
次の表は、PDF ドキュメント、Word ドキュメント、画像ファイルなどの半構造化ドキュメントによるカスタム分類子のトレーニングに関連するクォータを示しています。
説明 | クォータ/ガイドライン |
---|---|
全ドキュメントの最大ページ数 | 10,000 |
注釈ファイルの最大サイズ (全 CSV ファイルサイズを合わせたサイズ) | 5 MB |
ドキュメントコーパスサイズ (トレーニングドキュメントとテストドキュメント) | 10 GB |
トレーニングファイルとテストファイルのファイルサイズ | |
画像ファイルサイズ (JPG、PNG、TIFF)。 | 1 バイト~10 MB。 TIFF ファイル:最大 1 ページ。 |
PDF ドキュメントのページサイズ | 1 バイト~10 MB |
Word ドキュメントのページサイズ | 1 バイト~10 MB |
Amazon Textract API 出力 JSON サイズ | 1 バイト~1 MB |
リアルタイム (同期) 分析
このセクションでは、半構造化ドキュメントのリアルタイム分類に関するクォータについて説明します。
次の表は、入力ドキュメントの最大ファイルサイズを示しています。すべての入力ドキュメントタイプで、入力ファイルの最大数は 1 ページで、10,000 文字以下です。
ファイルタイプ | 最大サイズ (API) | 最大サイズ (コンソール) |
---|---|---|
A UTF-8 テキストドキュメント | 10 KB | 10 KB |
PDF ドキュメント | 10 MB | 5 MB |
Word ドキュメント | 10 MB | 5 MB |
画像ファイル | 10 MB | 5 MB |
Amazon Textract API 出力サイズ | 1 MB | 該当なし |
非同期分析
次の表では、半構造化ドキュメントの非同期分類に関連するクォータについて説明しています。
説明 | クォータ/ガイドライン |
---|---|
ジョブのすべての入力ドキュメントの最大ページ数 | 25,000 |
ドキュメントコーパスサイズ | 25 GB |
画像ファイルサイズ (JPG、PNG、TIFF) | 1 バイト~10 MB。 TIFF ファイル:最大 1 ページ。 |
PDF ドキュメントのページサイズ | 1 バイト~10 MB |
Word ドキュメントのページサイズ | 1 バイト~10 MB |
Textract API 出力 JSON サイズ | 1 バイト~1 MB。 |
カスタムエンティティ認識
このセクションでは、カスタムエンティティレコグナイザーの以下の操作に関するガイドラインとクォータについて説明します。
CreateEntityRecognizerエンティティ認識トレーニングジョブは操作から開始されました。
非同期エンティティ認識ジョブは操作から開始されました。StartEntitiesDetectionJob
オペレーションを使用した同期エンティティ認識リクエスト。DetectEntities
プレーンテキストドキュメントのカスタムエンティティレコグナイザー
Amazon Comprehend には、カスタムエンティティレコグナイザーを使用してプレーンテキストドキュメントを分析するための非同期操作と同期操作が用意されています。
トレーニング
このセクションでは、プレーンテキストドキュメントを分析するためのカスタムエンティティレコグナイザーのトレーニングに関連するクォータについて説明します。モデルをトレーニングするには、エンティティリストまたは注釈付きテキストドキュメントのセットを提供できます。
次の表では、エンティティリストを使用したモデルのトレーニングに関連するクォータについて説明しています。
説明 | クォータ/ガイドライン |
---|---|
1 モデルあたりのエンティティ数 | 1~25 |
ドキュメントサイズ (UTF-8) | 1~5,000 バイト |
エンティティリスト内の項目数 | 1~100 万 |
エントリリスト内の個々のエントリ (ポストストリップ) の長さ | 1~5,000 |
エンティティリストのコーパスサイズ (プレーンテキストの全ドキュメントを含む) | 5 KB~200 MB |
次の表では、注釈付きテキストドキュメント使用したモデルのトレーニングに関連するクォータについて説明しています。
説明 | クォータ/ガイドライン |
---|---|
モデル/カスタムエンティティレコグナイザーあたりのエンティティ数 | 1~25 |
ドキュメントサイズ (UTF-8) | 1~5,000 バイト |
ドキュメント数 (「プレーンテキスト注釈」 を参照) | 3~200,000 |
ドキュメントコーパスサイズ (プレーンテキストの全ドキュメントを含む) | 5 KB~200 MB |
エンティティごとの最小注釈数 | 25 |
リアルタイム (同期) 分析
次の表では、プレーンテキストドキュメントのリアルタイム分析に関連するクォータについて説明しています。
説明 | クォータ/ガイドライン |
---|---|
同期リクエスト 1 回あたりの最大ドキュメント数 | 1 |
最大テキストドキュメントサイズ (UTF-8 エンコード) | 5 KB |
非同期分析
次の表では、プレーンテキストドキュメントの非同期エンティティレコグナイザーに関連するクォータについて説明しています。
説明 | クォータ/ガイドライン |
---|---|
ドキュメントサイズ (UTF-8) | 1 バイト~1 MB |
最大ファイル数 (1 ファイルあたり 1 ドキュメント) | 1,000,000 |
最大合計行数、1 行につき 1 つのドキュメント (リクエストに含まれる全ファイル) | 1,000,000 |
ドキュメントコーパスサイズ (プレーンテキストの全ドキュメントを含む) | 1 バイト~5 GB |
半構造化ドキュメントのカスタムエンティティレコグナイザー
Amazon Comprehend には、カスタムエンティティレコグナイザーを使用して半構造化ドキュメントを分析するための非同期操作と同期操作が用意されています。注釈付き PDF ドキュメントを使用してモデルをトレーニングする必要があります。
トレーニング
次の表は、半構造化文書を分析するためのカスタム・エンティティ・レコグナイザー (CreateEntityRecognizer) のトレーニングに関連するクォータを示しています。
説明 | クォータ/ガイドライン |
---|---|
モデル/カスタムエンティティレコグナイザーあたりのエンティティ数 | 1~25 |
最大注釈ファイルサイズ (UTF-8 JSON) | 5 MB |
ドキュメント数 | 250~10,000 |
ドキュメントコーパスサイズ (プレーンテキストの全ドキュメントを含む) | 5 KB~1 GB |
エンティティごとの最小注釈数 | 100 |
カスタムエンティティレコグナイザーをトレーニングするための拡張マニフェストファイルの最大数 | 5 |
各拡張マニフェストファイルの属性名の最大数 | 5 |
属性名の最大長 | 63 文字 |
リアルタイム (同期) 分析
このセクションでは、半構造化ドキュメントのリアルタイム分析に関するクォータについて説明します。
次の表は、入力ドキュメントの最大ファイルサイズを示しています。すべての入力ドキュメントタイプで、入力ファイルの最大数は 1 ページで、10,000 文字以下です。
ファイルタイプ | 最大サイズ (API) | 最大サイズ (コンソール) |
---|---|---|
A UTF-8 テキストドキュメント | 10 KB | 10 KB |
PDF ドキュメント | 10 MB | 5 MB |
Word ドキュメント | 10 MB | 5 MB |
画像ファイル | 10 MB | 5 MB |
Textract 出力ファイル | 1 MB | 該当なし |
非同期分析
このセクションでは、半構造化ドキュメントの非同期分析のクォータについて説明します。
説明 | クォータ/ガイドライン |
---|---|
画像サイズ (JPG または PNG) | 1 バイト~10 MB |
画像サイズ (TIFF) | 1 バイト~10 MB。最大 1 ページ。 |
ドキュメントサイズ (PDF) | 1 バイト~50 MB |
ドキュメントサイズ (Docx) | 1 バイト~5 MB |
ドキュメントサイズ (UTF-8) | 1 バイト~1 MB |
最大ファイル数、1 ファイルあたり 1 ドキュメント (画像ファイルや PDF/Word ドキュメントでは 1 行に 1 つのドキュメントは使用できません) | 500 |
PDF または Docx ファイルの最大ページ数 | 100 |
テキスト抽出後のドキュメントコーパスサイズ (プレーンテキスト、すべてのファイルを含む) | 1 バイト~5 GB |
画像の制限の詳細については、「Amazon Textract のハードリミット」 を参照してください。
フライホイールのクォータ
フライホイールを使用して、カスタム分類とカスタムエンティティレコグナイザーのためのカスタムモデルバージョンのトレーニングと追跡を管理します。フライホイールの詳細については、「フライホイール」を参照してください。
フライホイールの一般的なクォータ
フライホイールとフライホイールイテレーションには以下のクォータが適用されます。
説明 | クォータ/ガイドライン |
---|---|
フライホイールの最大数 | 50 |
「CREATING」(作成中) 状態のフライホイールの最大数 | 10 |
フライホイールあたりのトレーニングデータセットの最大数 | 50 |
フライホイールあたりのテストデータセットの最大数 | 50 |
「インジェスト中」 状態のデータセットの最大数 | 10 |
アカウントごとの進行中のフライホイールイテレーションの最大数 | 10 |
カスタム分類モデルのデータセットクォータ
カスタム分類モデルに関連するフライホイールにデータセットを取り込むと、次のクォータが適用されます。
説明 | クォータ/ガイドライン |
---|---|
クラスあたりのトレーニングドキュメントの最小数 (複数ラベルモード) | 50 |
トレーニングドキュメントの最大数 | 1,000,000 |
最小データセットサイズ | 500 バイト |
最大データセットサイズ | 5 GB |
1 ファイルの最大ファイルサイズ、1 ファイルにつき 1 ドキュメント | 10 MB |
カスタムエンティティレコグナイザーモデルのデータセットクォータ
カスタムエンティティレコグナイザーモデルに関連するフライホイールのデータセットを取り込むと、次のクォータが適用されます。
説明 | クォータ/ガイドライン |
---|---|
最大ドキュメントサイズ | 5 KB |
トレーニングドキュメントの最小数 | 3 |
トレーニングドキュメントの最大数 | 200,000 件の |
エンティティごとの最小注釈数 | 25 |
最大データセットサイズ | 200 MB |