

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# DetectDocumentText
<a name="API_DetectDocumentText"></a>

入力ドキュメント内のテキストを検出します。Amazon Textract では、テキスト行とテキスト行を構成する単語を検出できます。入力ドキュメントは、JPEG、PNG、PDF、または TIFF 形式の画像である必要があります。`DetectDocumentText`検出されたテキストを次の配列で返します。[Block](API_Block.md)オブジェクト。

各ドキュメントページには、`Block`タイプの PAGE。各ページ`Block`オブジェクトはLINEの親です`Block`ページ上で検出されたテキストの行を表すオブジェクト。[1 行]`Block`オブジェクトは、行を構成する各単語の親です。単語は次のように表されます。`Block`WORD 型のオブジェクト。

 `DetectDocumentText` は同期演算です。ドキュメントを非同期的に分析するには、[StartDocumentTextDetection](API_StartDocumentTextDetection.md)。

詳細については、「」を参照してください。[ドキュメントのテキストの検出](https://docs.aws.amazon.com/textract/latest/dg/how-it-works-detecting.html)。

## リクエストの構文
<a name="API_DetectDocumentText_RequestSyntax"></a>

```
{
   "Document": { 
      "Bytes": blob,
      "S3Object": { 
         "Bucket": "string",
         "Name": "string",
         "Version": "string"
      }
   }
}
```

## リクエストパラメータ
<a name="API_DetectDocumentText_RequestParameters"></a>

リクエストは以下の JSON 形式のデータを受け入れます。

 ** [Document](#API_DetectDocumentText_RequestSyntax) **   <a name="Textract-DetectDocumentText-request-Document"></a>
base64 でエンコードされたバイトまたは Amazon S3 オブジェクトとしての入力ドキュメント。AWS CLI を使用して Amazon Textract オペレーションを呼び出す場合、イメージバイトを渡すことはできません。ドキュメントは、JPEG または PNG 形式であることが必要です。  
AWS SDK を使用して Amazon Textract を呼び出す場合は、を使用して渡されるイメージバイトを base64 エンコードする必要がない場合があります。`Bytes`フィールド。  
型: [Document](API_Document.md) オブジェクト  
: 必須 はい

## レスポンスの構文
<a name="API_DetectDocumentText_ResponseSyntax"></a>

```
{
   "Blocks": [ 
      { 
         "BlockType": "string",
         "ColumnIndex": number,
         "ColumnSpan": number,
         "Confidence": number,
         "EntityTypes": [ "string" ],
         "Geometry": { 
            "BoundingBox": { 
               "Height": number,
               "Left": number,
               "Top": number,
               "Width": number
            },
            "Polygon": [ 
               { 
                  "X": number,
                  "Y": number
               }
            ]
         },
         "Id": "string",
         "Page": number,
         "Relationships": [ 
            { 
               "Ids": [ "string" ],
               "Type": "string"
            }
         ],
         "RowIndex": number,
         "RowSpan": number,
         "SelectionStatus": "string",
         "Text": "string",
         "TextType": "string"
      }
   ],
   "DetectDocumentTextModelVersion": "string",
   "DocumentMetadata": { 
      "Pages": number
   }
}
```

## レスポンス要素
<a name="API_DetectDocumentText_ResponseElements"></a>

アクションが成功すると、サービスは HTTP 200 レスポンスを返します。

サービスから以下のデータが JSON 形式で返されます。

 ** [Blocks](#API_DetectDocumentText_ResponseSyntax) **   <a name="Textract-DetectDocumentText-response-Blocks"></a>
の配列`Block`文書内で検出されたテキストを含むオブジェクト。  
Type: の配列[Block](API_Block.md)オブジェクト

 ** [DetectDocumentTextModelVersion](#API_DetectDocumentText_ResponseSyntax) **   <a name="Textract-DetectDocumentText-response-DetectDocumentTextModelVersion"></a>
  
Type: 文字列

 ** [DocumentMetadata](#API_DetectDocumentText_ResponseSyntax) **   <a name="Textract-DetectDocumentText-response-DocumentMetadata"></a>
ドキュメントに関するメタデータ。ドキュメント内で検出されたページ数が含まれます。  
型: [DocumentMetadata](API_DocumentMetadata.md) オブジェクト

## エラー
<a name="API_DetectDocumentText_Errors"></a>

 ** AccessDeniedException **   
そのアクションを実行する権限がありません。そのオペレーションを実行するには、承認されたユーザーまたは IAM ロールの Amazon リソースネーム (ARN) を使用します。  
HTTP ステータスコード: 400

 ** BadDocumentException **   
Amazon Textract はドキュメントを読み取ることができません。Amazon Textract のドキュメント制限の詳細については、「」を参照してください。[Amazon Textract のハード制限](limits.md)。  
HTTP ステータスコード: 400

 ** DocumentTooLargeException **   
文書が大きすぎるため処理できません。10 MB の同期オペレーションの最大ドキュメントサイズ。非同期操作の最大ドキュメントサイズは、PDF ファイルの場合 500 MB です。  
HTTP ステータスコード: 400

 ** InternalServerError **   
Amazon Textract でサービスの問題が発生しました。もう一度やり直してください。  
HTTP ステータスコード: 500

 ** InvalidParameterException **   
入力パラメータが制約に違反しています。たとえば、同期操作では、`InvalidParameterException`例外が発生するのは、どちらも`S3Object`または`Bytes`値は、`Document`リクエストパラメータ。API オペレーションを再度呼び出す前にパラメータを検証します。  
HTTP ステータスコード: 400

 ** InvalidS3ObjectException **   
Amazon Textract は、リクエストで指定された S3 オブジェクトにアクセスできません。詳細については、[Amazon S3 へのアクセスの設定](https://docs.aws.amazon.com/AmazonS3/latest/dev/s3-access-control.html)トラブルシューティング情報については、「」を参照してください。[Amazon S3 トラブルシューティング](https://docs.aws.amazon.com/AmazonS3/latest/dev/troubleshooting.html)   
HTTP ステータスコード: 400

 ** ProvisionedThroughputExceededException **   
お客様のスループット制限を超えたリクエストの数。この上限を引き上げる場合は、Amazon Textract までお問い合わせください。  
HTTP ステータスコード: 400

 ** ThrottlingException **   
Amazon Textract は一時的にリクエストを処理できませんでした。もう一度やり直してください。  
HTTP ステータスコード: 500

 ** UnsupportedDocumentException **   
入力ドキュメントの形式はサポートされていません。操作用のドキュメントは、PNG、JPEG、PDF、または TIFF 形式にすることができます。  
HTTP ステータスコード: 400

## 以下の資料も参照してください。
<a name="API_DetectDocumentText_SeeAlso"></a>

言語固有の AWS SDK のいずれかでこの API を使用する方法の詳細については、次を参照してください：
+  [AWS Command Line Interface](https://docs.aws.amazon.com/goto/aws-cli/textract-2018-06-27/DetectDocumentText) 
+  [AWS SDK for .NET](https://docs.aws.amazon.com/goto/DotNetSDKV3/textract-2018-06-27/DetectDocumentText) 
+  [AWS SDK for C\$1\$1](https://docs.aws.amazon.com/goto/SdkForCpp/textract-2018-06-27/DetectDocumentText) 
+  [AWS SDK for Go](https://docs.aws.amazon.com/goto/SdkForGoV1/textract-2018-06-27/DetectDocumentText) 
+  [AWSSDK for Java V2](https://docs.aws.amazon.com/goto/SdkForJavaV2/textract-2018-06-27/DetectDocumentText) 
+  [AWS SDK for JavaScript](https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/textract-2018-06-27/DetectDocumentText) 
+  [AWS SDK for PHP V3](https://docs.aws.amazon.com/goto/SdkForPHPV3/textract-2018-06-27/DetectDocumentText) 
+  [AWS SDK for Python](https://docs.aws.amazon.com/goto/boto3/textract-2018-06-27/DetectDocumentText) 
+  [AWS SDK for Ruby v3](https://docs.aws.amazon.com/goto/SdkForRubyV3/textract-2018-06-27/DetectDocumentText) 