

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

# DetectDocumentText
<a name="API_DetectDocumentText"></a>

Detecta el texto del documento de entrada. Amazon Textract Texact puede detectar líneas de texto y las palabras que componen una línea de texto. El documento de entrada debe ser una imagen en formato JPEG, PNG, PDF o TIFF.`DetectDocumentText`devuelve el texto detectado en una matriz de[Block](API_Block.md)objetos. 

Cada página de documento tiene como asociado`Block`de tipo PAGE. Cada PÁGINA`Block`object es el principal de LINE`Block`objetos que representan las líneas del texto detectado en una página. UNA LÍNEA`Block`objeto es un padre para cada palabra que forma la línea. Las palabras están representadas por`Block`objetos de tipo WORD.

 `DetectDocumentText`es una operación síncrona. Para analizar documentos de forma asíncrona, utilice[StartDocumentTextDetection](API_StartDocumentTextDetection.md).

Para obtener más información, consulte[Detección de texto de documentos](https://docs.aws.amazon.com/textract/latest/dg/how-it-works-detecting.html).

## Sintaxis de la solicitud
<a name="API_DetectDocumentText_RequestSyntax"></a>

```
{
   "Document": { 
      "Bytes": blob,
      "S3Object": { 
         "Bucket": "string",
         "Name": "string",
         "Version": "string"
      }
   }
}
```

## Parámetros de solicitud
<a name="API_DetectDocumentText_RequestParameters"></a>

La solicitud acepta los siguientes datos en formato JSON.

 ** [Document](#API_DetectDocumentText_RequestSyntax) **   <a name="Textract-DetectDocumentText-request-Document"></a>
El documento de entrada como bytes codificados en base64 o un objeto Amazon S3. Si utiliza la CLI de AWS para llamar a las operaciones de Amazon Textract Texact, no puede pasar bytes de imagen. El documento debe ser una imagen en formato JPEG o PNG.  
Si utiliza un SDK de AWS para llamar a Amazon Textract, es posible que no tenga que codificar en base 64 bytes de imagen que se pasan mediante el`Bytes`.   
Tipo: objeto [Document](API_Document.md)  
Obligatorio: Sí

## Sintaxis de la respuesta
<a name="API_DetectDocumentText_ResponseSyntax"></a>

```
{
   "Blocks": [ 
      { 
         "BlockType": "string",
         "ColumnIndex": number,
         "ColumnSpan": number,
         "Confidence": number,
         "EntityTypes": [ "string" ],
         "Geometry": { 
            "BoundingBox": { 
               "Height": number,
               "Left": number,
               "Top": number,
               "Width": number
            },
            "Polygon": [ 
               { 
                  "X": number,
                  "Y": number
               }
            ]
         },
         "Id": "string",
         "Page": number,
         "Relationships": [ 
            { 
               "Ids": [ "string" ],
               "Type": "string"
            }
         ],
         "RowIndex": number,
         "RowSpan": number,
         "SelectionStatus": "string",
         "Text": "string",
         "TextType": "string"
      }
   ],
   "DetectDocumentTextModelVersion": "string",
   "DocumentMetadata": { 
      "Pages": number
   }
}
```

## Elementos de respuesta
<a name="API_DetectDocumentText_ResponseElements"></a>

Si la acción se realiza correctamente, el servicio devuelve una respuesta HTTP 200.

El servicio devuelve los datos siguientes en formato JSON.

 ** [Blocks](#API_DetectDocumentText_ResponseSyntax) **   <a name="Textract-DetectDocumentText-response-Blocks"></a>
Una matriz de`Block`objetos que contienen el texto detectado en el documento.  
Type: Matriz de[Block](API_Block.md)objects

 ** [DetectDocumentTextModelVersion](#API_DetectDocumentText_ResponseSyntax) **   <a name="Textract-DetectDocumentText-response-DetectDocumentTextModelVersion"></a>
  
Type: Cadena

 ** [DocumentMetadata](#API_DetectDocumentText_ResponseSyntax) **   <a name="Textract-DetectDocumentText-response-DocumentMetadata"></a>
Metadatos sobre el documento. Contiene el número de páginas detectadas en el documento.  
Tipo: objeto [DocumentMetadata](API_DocumentMetadata.md)

## Errores
<a name="API_DetectDocumentText_Errors"></a>

 ** AccessDeniedException **   
No tiene autorización para realizar la acción. Utilice el nombre de recurso de Amazon (ARN) de un usuario autorizado o un rol de IAM para realizar la operación.  
Código de estado HTTP: 400

 ** BadDocumentException **   
Amazon Textract Texact no puede leer el documento. Para obtener más información sobre los límites de documentos en Amazon Textract, consulte[Límites máximos de Amazon Textract](limits.md).  
Código de estado HTTP: 400

 ** DocumentTooLargeException **   
El documento no se puede procesar porque es demasiado grande. Tamaño máximo de documento para operaciones síncronas de 10 MB. El tamaño máximo de documento para las operaciones asíncronas es de 500 MB para los archivos PDF.  
Código de estado HTTP: 400

 ** InternalServerError **   
Amazon Textract ha tenido un problema de servicio. Pruebe la llamada de nuevo.  
Código de estado HTTP: 500

 ** InvalidParameterException **   
Un parámetro de entrada infringió una restricción. Por ejemplo, en operaciones sincrónicas, un`InvalidParameterException`se produce cuando ninguno de los`S3Object`o`Bytes`los valores se proporcionan en el`Document`parámetro de solicitud. Valide el parámetro antes de llamar a la operación de la API de nuevo.  
Código de estado HTTP: 400

 ** InvalidS3ObjectException **   
Amazon Textract no puede obtener acceso al objeto de S3 que se especificó en la solicituda. para obtener más información,[Configuración del acceso a Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/dev/s3-access-control.html)Para obtener información sobre la resolución de problemas, consulte[Solución de problemas de Amazon S3](https://docs.aws.amazon.com/AmazonS3/latest/dev/troubleshooting.html)   
Código de estado HTTP: 400

 ** ProvisionedThroughputExceededException **   
El número de solicitudes ha superado su límite de rendimiento. Si necesita aumentar este límite, póngase en contacto con Amazon Textract.  
Código de estado HTTP: 400

 ** ThrottlingException **   
Amazon Textract Texact no puede procesar temporalmente la solicitud. Pruebe la llamada de nuevo.  
Código de estado HTTP: 500

 ** UnsupportedDocumentException **   
El formato del documento de entrada no se admite. Los documentos para operaciones pueden estar en formato PNG, JPEG, PDF o TIFF.  
Código de estado HTTP: 400

## Véase también
<a name="API_DetectDocumentText_SeeAlso"></a>

Para obtener más información sobre el uso de esta API en un SDK de AWS de un lenguaje específico, consulte:
+  [AWS Command Line Interface](https://docs.aws.amazon.com/goto/aws-cli/textract-2018-06-27/DetectDocumentText) 
+  [SDK de AWS para .NET](https://docs.aws.amazon.com/goto/DotNetSDKV3/textract-2018-06-27/DetectDocumentText) 
+  [AWS SDK para C\$1\$1](https://docs.aws.amazon.com/goto/SdkForCpp/textract-2018-06-27/DetectDocumentText) 
+  [AWS SDK para Go](https://docs.aws.amazon.com/goto/SdkForGoV1/textract-2018-06-27/DetectDocumentText) 
+  [AWSSDK para Java V2](https://docs.aws.amazon.com/goto/SdkForJavaV2/textract-2018-06-27/DetectDocumentText) 
+  [AWS SDK para JavaScript](https://docs.aws.amazon.com/goto/AWSJavaScriptSDK/textract-2018-06-27/DetectDocumentText) 
+  [SDK de AWS para PHP V3](https://docs.aws.amazon.com/goto/SdkForPHPV3/textract-2018-06-27/DetectDocumentText) 
+  [SDK de AWS para Python](https://docs.aws.amazon.com/goto/boto3/textract-2018-06-27/DetectDocumentText) 
+  [SDK de AWS para Ruby V3](https://docs.aws.amazon.com/goto/SdkForRubyV3/textract-2018-06-27/DetectDocumentText) 