Tabelle - Amazon Textract

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Tabelle

Amazon Textract può estrarre tabelle e celle di una tabella. Ad esempio, quando viene rilevata la tabella seguente in un modulo, Amazon Textract rileva una tabella con quattro celle.

Nome Indirizzo

Ana Carolina

123 Qualsiasi città

Le tabelle rilevate vengono restituite comeBlockoggetti nelle risposte daAnalyzeDocumenteGetDocumentAnalysis. Puoi utilizzare il pluginFeatureTypesparametro di input per recuperare informazioni su coppie chiave-valore, tabelle o entrambi. Solo per le tabelle, utilizzare il valoreTABLES. Per un esempio, consultare Esportazione di tabelle in un file CSV. Per informazioni generali sul modo in cui un documento è rappresentato daBlockoggetti, vediOggetti di risposta di rilevamento del testo e analisi dei documenti.

Il diagramma riportato di seguito illustra come viene rappresentata una singola cella in una tabella.Blockobjects.

Una cella contieneWORDblocchi per parole rilevate eSELECTION_ELEMENTblocchi per elementi di selezione come caselle di controllo.

Di seguito è riportato un JSON parziale per la tabella precedente, che ha quattro celle.

L'oggetto PAGE Block contiene un elenco di ID Blocco FIGLIO per il blocco TABLE e ogni LINEA di testo rilevata.

{ "Geometry": {...}, "Relationships": [ { "Type": "CHILD", "Ids": [ "f2a4ad7b-f21d-4966-b548-c859b84f66a4", // Line - Name "4dce3516-ffeb-45e0-92a2-60770e9cb744", // Line - Address "ee506578-768f-4696-8f4b-e4917e429f50", // Line - Ana Carolina "33fc7223-411b-4399-8a90-ccd3c5a2c196", // Line - 123 Any Town "3f9665be-379d-4ae7-be44-d02f32b049c2" // Table ] } ], "BlockType": "PAGE", "Id": "78c3ce84-ae70-418e-add7-27058418adf6" },

Il blocco TABLE include un elenco di ID figlio per le celle all'interno della tabella. Un blocco TABLE include anche informazioni sulla geometria per la posizione della tabella nel documento. Il seguente JSON mostra che la tabella ha quattro celle, elencate nellaIdsarray.

{ "Geometry": {...}, "Relationships": [ { "Type": "CHILD", "Ids": [ "505e9581-0d1c-42fb-a214-6ff736822e8c", "6fca44d4-d3d3-46ab-b22f-7fca1fbaaf02", "9778bd78-f3fe-4ae1-9b78-e6d29b89e5e9", "55404b05-ae12-4159-9003-92b7c129532e" ] } ], "BlockType": "TABLE", "Confidence": 92.5705337524414, "Id": "3f9665be-379d-4ae7-be44-d02f32b049c2" },

Il tipo di blocco per le celle della tabella è CELL. LaBlockl'oggetto per ogni cella include informazioni sulla posizione della cella rispetto ad altre celle della tabella. Include inoltre informazioni sulla geometria per la posizione della cella sul documento. Nell'esempio precedente,505e9581-0d1c-42fb-a214-6ff736822e8cè l'ID figlio per la cella che contiene la parolaNome. L'esempio seguente sono le informazioni per la cella.

{ "Geometry": {...}, "Relationships": [ { "Type": "CHILD", "Ids": [ "e9108c8e-0167-4482-989e-8b6cd3c3653e" ] } ], "Confidence": 100.0, "RowSpan": 1, "RowIndex": 1, "ColumnIndex": 1, "ColumnSpan": 1, "BlockType": "CELL", "Id": "505e9581-0d1c-42fb-a214-6ff736822e8c" },

Ogni cella ha una posizione in una tabella, con la prima cella 1,1. Nell'esempio precedente, la cella con il valoreNomeè alla riga 1, colonna 1. La cella con il valore123 Qualsiasi cittàè alla riga 2, colonna 2. Un oggetto blocco di celle contiene queste informazioni nelRowIndexeColumnIndex. L'elenco figlio contiene gli ID per gli oggetti WORD Block che contengono il testo che si trova all'interno della cella. Le parole nell'elenco sono nell'ordine in cui vengono rilevate, dall'alto a sinistra della cella in basso a destra della cella. Nell'esempio precedente, la cella ha un ID figlio con il valore e9108c8e-0167-4482-989e-8b6cd3c3653e. Il seguente output è per il WORD Block con il valore ID di e9108c8e-0167-4482-989e-8b6cd3c3653e:

"Geometry": {...}, "Text": "Name", "TextType": "Printed", "BlockType": "WORD", "Confidence": 99.81139373779297, "Id": "e9108c8e-0167-4482-989e-8b6cd3c3653e" },