Modalità di elaborazione dei documenti - Amazon Comprehend

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Modalità di elaborazione dei documenti

Amazon Comprehend supporta tre modalità di elaborazione dei documenti. La modalità scelta dipende dal numero di documenti da elaborare e dall'immediatezza con cui è necessario visualizzare i risultati:

  • Documento singolo sincrono: chiami Amazon Comprehend con un singolo documento e ricevi una risposta sincrona, consegnata immediatamente alla tua applicazione (o alla console).

  • Sincrona multi-documento: richiami l'API Amazon Comprehend con una raccolta di un massimo di 25 documenti e ricevi una risposta sincrona.

  • Batch asincrono: per un'ampia raccolta di documenti, inserisci i documenti in un bucket Amazon S3 e avvia un processo asincrono (utilizzando operazioni di console o API) per analizzare i documenti. Amazon Comprehend archivia i risultati dell'analisi nel bucket/cartella S3 specificato nella richiesta.

Elaborazione di un singolo documento

Le operazioni su un singolo documento sono operazioni sincrone che restituiscono i risultati dell'analisi del documento direttamente all'applicazione. Utilizzate le operazioni sincrone a documento singolo quando create un'applicazione interattiva che funziona su un documento alla volta.

Per ulteriori informazioni sulle operazioni sincrone dell'API, vedere Analisi in tempo reale utilizzando i modelli integrati (per console) e. Analisi in tempo reale tramite l'API

Elaborazione sincrona di più documenti

Se desideri elaborare più documenti, puoi utilizzare le operazioni Batch* API per inviare più di un documento ad Amazon Comprehend alla volta. Puoi inviare fino a 25 documenti per richiesta. Amazon Comprehend restituisce un elenco di risposte, una per ogni documento della richiesta. Le richieste effettuate con queste operazioni sono sincrone. L'applicazione richiama l'operazione e quindi attende la risposta dal servizio.

L'utilizzo Batch* delle operazioni è identico alla chiamata delle API del singolo documento per ciascuno dei documenti nella richiesta. L'utilizzo di queste API può comportare prestazioni migliori per le applicazioni.

L'input di ciascuna API è una struttura JSON contenente i documenti da elaborare. Per tutte le operazioni tranneBatchDetectDominantLanguage, è necessario impostare la lingua di input. È possibile impostare una sola lingua di input per ogni richiesta. Ad esempio, quanto segue è l'input dell'BatchDetectEntitiesoperazione. Contiene due documenti ed è in inglese.

{ "LanguageCode": "en", "TextList": [ "I have been living in Seattle for almost 4 years", "It is raining today in Seattle" ] }

La risposta di un'Batch*operazione contiene due elenchi, il ResultList e ilErrorList. ResultListContiene un record per ogni documento che è stato elaborato correttamente. Il risultato per ogni documento della richiesta è identico al risultato che si otterrebbe eseguendo una singola operazione sul documento. Ai risultati di ogni documento viene assegnato un indice basato sull'ordine dei documenti nel file di input. La risposta dell'BatchDetectEntitiesoperazione è:

{ "ResultList" : [ { "Index": 0, "Entities": [ { "Text": "Seattle", "Score": 0.95, "Type": "LOCATION", "BeginOffset": 22, "EndOffset": 29 }, { "Text": "almost 4 years", "Score": 0.89, "Type": "QUANTITY", "BeginOffset": 34, "EndOffset": 48 } ] }, { "Index": 1, "Entities": [ { "Text": "today", "Score": 0.87, "Type": "DATE", "BeginOffset": 14, "EndOffset": 19 }, { "Text": "Seattle", "Score": 0.96, "Type": "LOCATION", "BeginOffset": 23, "EndOffset": 30 } ] } ], "ErrorList": [] }

Quando si verifica un errore nella richiesta, la risposta contiene un messaggio ErrorList che identifica i documenti che contenevano l'errore. Il documento è identificato dal relativo indice nell'elenco di input. Ad esempio, il seguente input dell'BatchDetectLanguageoperazione contiene un documento che non può essere elaborato:

{ "TextList": [ "hello friend", "$$$$$$", "hola amigo" ] }

La risposta di Amazon Comprehend include un elenco di errori che identifica il documento che conteneva un errore:

{ "ResultList": [ { "Index": 0, "Languages":[ { "LanguageCode":"en", "Score": 0.99 } ] }, { "Index": 2 "Languages":[ { "LanguageCode":"es", "Score": 0.82 } ] } ], "ErrorList": [ { "Index": 1, "ErrorCode": "InternalServerException", "ErrorMessage": "Unexpected Server Error. Please try again." } ] }

Per ulteriori informazioni sulle operazioni sincrone dell'API in batch, consulta. API batch in tempo reale

Elaborazione asincrona in batch

Per analizzare documenti di grandi dimensioni e grandi raccolte di documenti, utilizza le operazioni asincrone di Amazon Comprehend.

Per analizzare una raccolta di documenti, in genere esegui i seguenti passaggi:

  1. Archivia i documenti in un bucket Amazon S3.

  2. Avvia uno o più processi di analisi per analizzare i documenti.

  3. Monitora lo stato di avanzamento dei lavori di analisi.

  4. Recupera i risultati dell'analisi da un bucket S3 quando il lavoro è completo.

Per ulteriori informazioni sull'utilizzo delle operazioni API asincrone, consulta (console) e. Esecuzione di processi di analisi utilizzando la console Lavori di analisi asincrona utilizzando l'API