GetDocumentAnalysis - Amazon Textract

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

GetDocumentAnalysis

Ottiene i risultati di un'operazione asincrona Amazon Textract che analizza il testo in un documento.

Si avvia l'analisi asincrona del testo chiamandoStartDocumentAnalysis, che restituisce un identificatore di lavoro (JobId). Al termine dell'operazione di analisi del testo, Amazon Textract pubblica uno stato di completamento nell'argomento Amazon Simple Notification Service (Amazon SNS) registrato nella chiamata iniziale aStartDocumentAnalysis. Per ottenere i risultati dell'operazione di rilevamento del testo, verificare innanzitutto che il valore di stato pubblicato nell'argomento Amazon SNS siaSUCCEEDED. Se è così, chiamaGetDocumentAnalysise passa l'identificativo del processo (JobId) dalla chiamata iniziale aStartDocumentAnalysis.

GetDocumentAnalysisrestituisce una matrice diBlockoggetti. Vengono restituiti i seguenti tipi di informazioni:

  • Dati di modulo (coppie chiave-valore). Le informazioni correlate vengono restituite in dueBlockoggetti, ciascuno di tipoKEY_VALUE_SET: KEYBlockoggetto e un VALOREBlockoggetto. Ad esempio:Nome: Ana Silva Carolinacontiene una chiave e un valore. Nome:è la chiave. Ana Silva Carolinaè il valore.

  • Dati delle celle di tabella e tabella. UNA TABELLABlockobject contiene informazioni su una tabella rilevata. CELLABlockl'oggetto viene restituito per ogni cella di una tabella.

  • Linee e parole di testo. RIGABlockl'oggetto contiene una o più WORDBlockoggetti. Vengono restituite tutte le righe e le parole rilevate nel documento (incluso il testo che non ha una relazione con il valore delStartDocumentAnalysis FeatureTypesparametro di input).

Elementi di selezione come caselle di controllo e pulsanti di opzione (pulsanti di opzione) possono essere rilevati nei dati del modulo e nelle tabelle. UN ELEMENTO SELECTION_ELEMENTBlockobject contiene informazioni su un elemento di selezione, incluso lo stato della selezione.

Utilizzo dell'MaxResultsparametro per limitare il numero di blocchi restituiti. Se ci sono più risultati di quelli specificati inMaxResults, il valore diNextTokennella risposta dell'operazione contiene un token di impaginazione per ottenere il successivo set di risultati. Per visualizzare la pagina di risultati successiva, chiamaGetDocumentAnalysise popolareNextTokenparametro request con il valore del token restituito dalla chiamata precedente aGetDocumentAnalysis.

Per ulteriori informazioni, consultaAnalisi del testo del documento.

Sintassi della richiesta

{ "JobId": "string", "MaxResults": number, "NextToken": "string" }

Parametri della richiesta

La richiesta accetta i seguenti dati in formato JSON.

JobId

Identificatore univoco per il processo di rilevamento del testo. LaJobIdrestituisce daStartDocumentAnalysis. UNJobIdIl valore è valido solo per 7 giorni.

Type: Stringa

Vincoli di lunghezza: Lunghezza minima pari a 1. La lunghezza massima è 64 caratteri.

Modello: ^[a-zA-Z0-9-_]+$

Campo obbligatorio: Sì

MaxResults

Numero massimo di risultati da restituire per ogni chiamata impaginata. Il valore maggiore che puoi specificare è 1.000. Se si specifica un valore maggiore di 1.000, vengono restituiti al massimo 1.000 risultati. Il valore predefinito è 1,000.

Type: Numero intero

Intervallo valido: Valore minimo di 1.

Campo obbligatorio: No

NextToken

Se la risposta precedente era incompleta (perché ci sono più blocchi da recuperare), Amazon Textract restituisce un token di impaginazione nella risposta. È possibile utilizzare questo token di impaginazione per recuperare il successivo set di blocchi.

Type: Stringa

Vincoli di lunghezza: Lunghezza minima pari a 1. Lunghezza massima di 255.

Modello: .*\S.*

Campo obbligatorio: No

Sintassi della risposta

{ "AnalyzeDocumentModelVersion": "string", "Blocks": [ { "BlockType": "string", "ColumnIndex": number, "ColumnSpan": number, "Confidence": number, "EntityTypes": [ "string" ], "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Id": "string", "Page": number, "Relationships": [ { "Ids": [ "string" ], "Type": "string" } ], "RowIndex": number, "RowSpan": number, "SelectionStatus": "string", "Text": "string", "TextType": "string" } ], "DocumentMetadata": { "Pages": number }, "JobStatus": "string", "NextToken": "string", "StatusMessage": "string", "Warnings": [ { "ErrorCode": "string", "Pages": [ number ] } ] }

Elementi di risposta

Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.

I dati seguenti vengono restituiti in formato JSON mediante il servizio.

AnalyzeDocumentModelVersion

Type: Stringa

Blocks

I risultati dell'operazione di analisi testuale.

Type: Matrice diBlockoggetti

DocumentMetadata

Informazioni su un documento elaborato da Amazon Textract.DocumentMetadataviene restituito in ogni pagina delle risposte impaginate da un'operazione video di Amazon Textract.

Tipo: DocumentMetadata oggetto

JobStatus

Lo stato corrente del processo di rilevamento del testo.

Type: Stringa

Valori validi: IN_PROGRESS | SUCCEEDED | FAILED | PARTIAL_SUCCESS

NextToken

Se la risposta viene troncata, Amazon Textract restituisce questo token. È possibile utilizzare questo token nella richiesta seguente per recuperare il successivo set di risultati di rilevamento del testo.

Type: Stringa

Vincoli di lunghezza: Lunghezza minima pari a 1. Lunghezza massima di 255.

Modello: .*\S.*

StatusMessage

Restituisce se non è stato possibile completare il processo di rilevamento. Contiene una spiegazione per quale errore si è verificato.

Type: Stringa

Warnings

Un elenco di avvisi verificati durante l'operazione di analisi del documento.

Type: Matrice diWarningoggetti

Errori

AccessDeniedException

Non sei autorizzato a eseguire l'operazione. Utilizzare l'ARN (Amazon Resource Name) di un utente autorizzato o un ruolo IAM per eseguire l'operazione.

Codice di stato HTTP: 400

InternalServerError

Amazon Textract ha riscontrato un problema del servizio. Riprova la chiamata.

Codice di stato HTTP: 500

InvalidJobIdException

È stato passato un identificatore di lavoro non validoGetDocumentAnalysiso aGetDocumentAnalysis.

Codice di stato HTTP: 400

InvalidKMSKeyException

Indica che non si dispone delle autorizzazioni di decrittografia con la chiave KMS immessa o che la chiave KMS è stata immessa in modo errato.

Codice di stato HTTP: 400

InvalidParameterException

Un parametro di input ha violato un vincolo. Ad esempio, nelle operazioni sincrone, unInvalidParameterExceptioneccezione si verifica quando nessuno dei dueS3ObjectoBytesi valori sono forniti nelDocumentparametro di richiesta. Convalida il parametro prima di chiamare nuovamente l'operazione API.

Codice di stato HTTP: 400

InvalidS3ObjectException

Amazon Textract non è in grado di accedere all'oggetto S3 specificato nella richiesta.Configura l'accesso ad Amazon S3Per informazioni sulla risoluzione dei problemi, consultaRisoluzione dei problemi Amazon S3

Codice di stato HTTP: 400

ProvisionedThroughputExceededException

Il numero di richieste ha superato il limite di throughput. Per aumentare questo limite, contatta Amazon Textract.

Codice di stato HTTP: 400

ThrottlingException

Amazon Textract non è temporaneamente in grado di elaborare la richiesta. Riprova la chiamata.

Codice di stato HTTP: 500

Vedi anche

Per ulteriori informazioni sull'utilizzo di questa API in uno degli SDK AWS specifici della lingua, consulta quanto segue: