ドキュメント処理 - Amazon Comprehend

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ドキュメント処理

Amazon Comprehend では、カスタム分類とカスタムエンティティ認識でワンステップドキュメント処理を行うことができます。例えば、プレーンテキストドキュメントと半構造化ドキュメント(PDF ドキュメント、Microsoft Word ドキュメント、画像など)を組み合わせてカスタム分析ジョブに入力できます。

テキスト抽出が必要な入力ファイルの場合、Amazon Comprehend は分析を実行する前にテキスト抽出を自動的に実行します。テキストコンテンツを抽出する際、Amazon Comprehend はネイティブの半構造化ドキュメントに内部パーサーを使用し、画像やスキャンされたドキュメントには Amazon Textract API を使用します。

Amazon Comprehend ドキュメント処理は、Amazon Comprehend の各 で使用できます。ただしサポートされるリージョン、アジアパシフィック (東京) および AWS GovCloud (米国西部) では、カスタム分類のプレーンテキストモデルのみがサポートされています。

以下のトピックでは、Amazon Comprehend がカスタム分析でサポートしている入力ドキュメントの種類を詳しく説明します。