Single-document elaborazione Elaborazione sincrona di più documenti Elaborazione asincrona in batch

Modalità di elaborazione dei documenti

Amazon Comprehend supporta tre modalità di elaborazione dei documenti. La modalità scelta dipende dal numero di documenti da elaborare e dall'immediatezza con cui è necessario visualizzare i risultati:

Single-document sincrono: chiami Amazon Comprehend con un singolo documento e ricevi una risposta sincrona, inviata immediatamente alla tua applicazione (o alla console).
Multi-document sincrono: richiami l'API Amazon Comprehend con una raccolta di un massimo di 25 documenti e ricevi una risposta sincrona.
Batch asincrono: per un'ampia raccolta di documenti, inserisci i documenti in un bucket Amazon S3 e avvia un processo asincrono (utilizzando operazioni di console o API) per analizzare i documenti. Amazon Comprehend archivia i risultati dell'analisi nell'S3 bucket/folder specificato nella richiesta.

Single-document elaborazione

Single-document le operazioni sono operazioni sincrone che restituiscono i risultati dell'analisi del documento direttamente all'applicazione. Utilizzate le operazioni sincrone a documento singolo quando create un'applicazione interattiva che funziona su un documento alla volta.

Per ulteriori informazioni sulle operazioni sincrone dell'API, vedere Real-time analisi utilizzando i modelli integrati (per console) e. Real-time analisi utilizzando l'API

Elaborazione sincrona di più documenti

Se desideri elaborare più documenti, puoi utilizzare le operazioni Batch* API per inviare più di un documento ad Amazon Comprehend alla volta. Puoi inviare fino a 25 documenti per richiesta. Amazon Comprehend restituisce un elenco di risposte, una per ogni documento della richiesta. Le richieste effettuate con queste operazioni sono sincrone. L'applicazione richiama l'operazione e quindi attende la risposta dal servizio.

L'utilizzo Batch* delle operazioni è identico alla chiamata delle API del singolo documento per ciascuno dei documenti nella richiesta. L'utilizzo di queste API può comportare prestazioni migliori per le applicazioni.

L'input per ciascuna delle API è una struttura JSON contenente i documenti da elaborare. Per tutte le operazioni tranneBatchDetectDominantLanguage, è necessario impostare la lingua di input. È possibile impostare una sola lingua di input per ogni richiesta. Ad esempio, quanto segue è l'input dell'BatchDetectEntitiesoperazione. Contiene due documenti ed è in inglese.


{
   "LanguageCode": "en",
   "TextList": [
      "I have been living in Seattle for almost 4 years",
      "It is raining today in Seattle"
   ]
}

La risposta di un'Batch*operazione contiene due elenchi, il ResultList e ilErrorList. ResultListContiene un record per ogni documento che è stato elaborato correttamente. Il risultato per ogni documento della richiesta è identico al risultato che si otterrebbe eseguendo una singola operazione sul documento. Ai risultati di ogni documento viene assegnato un indice basato sull'ordine dei documenti nel file di input. La risposta dell'BatchDetectEntitiesoperazione è:


{
   "ResultList"  : [
      {
         "Index": 0,
         "Entities": [
            {
               "Text": "Seattle", 
               "Score": 0.95, 
               "Type": "LOCATION", 
               "BeginOffset": 22, 
               "EndOffset": 29
            },
            {
               "Text": "almost 4 years", 
               "Score": 0.89, 
               "Type": "QUANTITY", 
               "BeginOffset": 34, 
               "EndOffset": 48
            }
         ]
      },
      {
         "Index": 1,
         "Entities": [
            {
              "Text": "today",
              "Score": 0.87,
              "Type": "DATE",
              "BeginOffset": 14,
              "EndOffset": 19
            },
            {
               "Text": "Seattle",
               "Score": 0.96,
               "Type": "LOCATION",
               "BeginOffset": 23,
               "EndOffset": 30
            }
         ]
      }
   ],
   "ErrorList": []
}

Quando si verifica un errore nella richiesta, la risposta contiene un messaggio ErrorList che identifica i documenti che contenevano l'errore. Il documento è identificato dal relativo indice nell'elenco di input. Ad esempio, il seguente input dell'BatchDetectLanguageoperazione contiene un documento che non può essere elaborato:


{
   "TextList": [
     "hello friend", 
     "$$$$$$",
     "hola amigo"
   ]       
}

La risposta di Amazon Comprehend include un elenco di errori che identifica il documento che conteneva un errore:


{
    "ResultList": [
        {
          "Index": 0,
          "Languages":[
            {
              "LanguageCode":"en",
              "Score": 0.99
            }
          ]
        },
        {
          "Index": 2
          "Languages":[
            {
              "LanguageCode":"es",
              "Score": 0.82
            }
          ]
        }
    ],
    "ErrorList": [
      {
        "Index": 1,
        "ErrorCode": "InternalServerException",
        "ErrorMessage": "Unexpected Server Error. Please try again."
      }
    ]
}

Per ulteriori informazioni sulle operazioni sincrone dell'API in batch, consulta. Real-time API batch

Elaborazione asincrona in batch

Per analizzare documenti di grandi dimensioni e grandi raccolte di documenti, utilizza le operazioni asincrone di Amazon Comprehend.

Per analizzare una raccolta di documenti, in genere esegui i seguenti passaggi:

Archivia i documenti in un bucket Amazon S3.
Avvia uno o più processi di analisi per analizzare i documenti.
Monitora lo stato di avanzamento dei lavori di analisi.
Recupera i risultati dell'analisi da un bucket S3 quando il lavoro è completo.

Per ulteriori informazioni sull'utilizzo delle operazioni API asincrone, consulta (console) e. Esecuzione di processi di analisi utilizzando la console Lavori di analisi asincrona utilizzando l'API

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Modellazione degli argomenti

Lingue supportate