ドキュメント処理

Amazon Comprehend では、カスタム分類とカスタムエンティティ認識でワンステップドキュメント処理を行うことができます。例えば、プレーンテキストドキュメントと半構造化ドキュメント（PDF ドキュメント、Microsoft Word ドキュメント、画像など）を組み合わせてカスタム分析ジョブに入力できます。

テキスト抽出が必要な入力ファイルの場合、Amazon Comprehend は分析を実行する前にテキスト抽出を自動的に実行します。テキストコンテンツを抽出する際、Amazon Comprehend はネイティブの半構造化ドキュメントに内部パーサーを使用し、画像やスキャンされたドキュメントには Amazon Textract API を使用します。

Amazon Comprehend ドキュメント処理は、アジアパシフィック (東京) を除く各 Amazon Comprehend で利用できサポート対象のリージョン、カスタム分類のプレーンテキストモデルのみ AWS GovCloud (US-West) をサポートします。

以下のトピックでは、Amazon Comprehend がカスタム分析でサポートしている入力ドキュメントの種類を詳しく説明します。

トピック

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

PII エンティティの編集

リアルタイム分析用の入力