Esecuzione di processi di analisi per il riconoscimento personalizzato delle entità - Amazon Comprehend

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Esecuzione di processi di analisi per il riconoscimento personalizzato delle entità

È possibile eseguire un processo di analisi asincrono per rilevare entità personalizzate in un set di uno o più documenti.

Prima di iniziare

È necessario un modello di riconoscimento delle entità personalizzato (noto anche come riconoscimento) prima di poter rilevare le entità personalizzate. Per ulteriori informazioni su questi modelli, vedereAddestramento di modelli di riconoscimento di entità personalizzati.

Un programma di riconoscimento addestrato con annotazioni in testo semplice supporta il rilevamento delle entità solo per i documenti di testo semplice. Un programma di riconoscimento addestrato alle annotazioni dei documenti PDF supporta il rilevamento di entità per documenti di testo semplice, immagini, file PDF e documenti Word. Per i file diversi dai file di testo, Amazon Comprehend esegue l'estrazione del testo prima di eseguire l'analisi. Per informazioni sui file di input, consultaIngressi per analisi asincrone personalizzate.

Se prevedi di analizzare file di immagini o documenti PDF scansionati, la tua policy IAM deve concedere le autorizzazioni per utilizzare due metodi DetectDocumentText API Amazon Textract (e). AnalyzeDocument Amazon Comprehend richiama questi metodi durante l'estrazione del testo. Per un esempio di policy, consulta Autorizzazioni necessarie per eseguire azioni di analisi dei documenti.

Per eseguire un processo di analisi asincrona, esegui complessivamente i seguenti passaggi:

  1. Archivia i documenti in un bucket Amazon S3.

  2. Utilizza l'API o la console per avviare il processo di analisi.

  3. Monitora lo stato di avanzamento del processo di analisi.

  4. Una volta completato il processo, recupera i risultati dell'analisi dal bucket S3 che hai specificato all'avvio del lavoro.