

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# ドキュメント処理
<a name="idp"></a>

Amazon Comprehend では、カスタム分類とカスタムエンティティ認識でワンステップドキュメント処理を行うことができます。例えば、プレーンテキストドキュメントと半構造化ドキュメント（PDF ドキュメント、Microsoft Word ドキュメント、画像など）を組み合わせてカスタム分析ジョブに入力できます。

テキスト抽出が必要な入力ファイルの場合、Amazon Comprehend は分析を実行する前にテキスト抽出を自動的に実行します。テキストコンテンツを抽出する際、Amazon Comprehend はネイティブの半構造化ドキュメントに内部パーサーを使用し、画像やスキャンされたドキュメントには Amazon Textract API を使用します。

Amazon Comprehend ドキュメント処理は、アジアパシフィック (東京) と AWS GovCloud (米国西部) がカスタム分類のプレーンテキストモデルのみをサポートしている点を除いて[サポート対象のリージョン](guidelines-and-limits.md#limits-regions)、各 Amazon Comprehend で利用できます。

以下のトピックでは、Amazon Comprehend がカスタム分析でサポートしている入力ドキュメントの種類を詳しく説明します。

**Topics**
+ [リアルタイムカスタム分析用の入力](idp-inputs-sync.md)
+ [非同期カスタム分析の入力　](idp-inputs-async.md)
+ [テキスト抽出オプションの設定](idp-set-textract-options.md)
+ [画像のベストプラクティス](idp-images-bp.md)