Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Nach Abschluss eines Analysejobs werden die Ergebnisse in dem S3-Bucket gespeichert, den Sie in der Anfrage angegeben haben.
Ausgaben für Texteingaben
Bei Texteingabedateien besteht die Ausgabe aus einer Liste von Entitäten für jedes Eingabedokument.
Das folgende Beispiel zeigt die Ausgabe für zwei Dokumente aus einer Eingabedatei mit dem Namen50_docs, wobei das Format „Ein Dokument pro Zeile“ verwendet wird.
{
"File": "50_docs",
"Line": 0,
"Entities":
[
{
"BeginOffset": 0,
"EndOffset": 22,
"Score": 0.9763959646224976,
"Text": "John Johnson",
"Type": "JUDGE"
}
]
}
{
"File": "50_docs",
"Line": 1,
"Entities":
[
{
"BeginOffset": 11,
"EndOffset": 15,
"Score": 0.9615424871444702,
"Text": "Thomas Kincaid",
"Type": "JUDGE"
}
]
}
Ausgaben für halbstrukturierte Eingaben
Bei halbstrukturierten Eingabedokumenten kann die Ausgabe die folgenden zusätzlichen Felder enthalten:
DocumentMetadata — Extraktionsinformationen über das Dokument. Die Metadaten enthalten eine Liste von Seiten im Dokument, wobei die Anzahl der Zeichen aus jeder Seite extrahiert wurde. Dieses Feld ist in der Antwort vorhanden, wenn die Anfrage den
Byte
Parameter enthielt.DocumentType — Der Dokumenttyp für jede Seite im Eingabedokument. Dieses Feld ist in der Antwort auf eine Anfrage enthalten, die den
Byte
Parameter enthielt.Blöcke — Informationen zu den einzelnen Textblöcken im Eingabedokument. Blöcke können sich innerhalb eines Blocks verschachteln. Ein Seitenblock enthält für jede Textzeile einen Block, der für jedes Wort einen Block enthält. Dieses Feld ist in der Antwort auf eine Anfrage enthalten, die den
Byte
Parameter enthielt.BlockReferences — Ein Verweis auf jeden Block für diese Entität. Dieses Feld ist in der Antwort auf eine Anfrage enthalten, die den
Byte
Parameter enthielt. Das Feld ist für Textdateien nicht vorhanden.Fehler — Fehler auf Seitenebene, die das System bei der Verarbeitung des Eingabedokuments erkannt hat. Das Feld ist leer, wenn das System keine Fehler festgestellt hat.
Weitere Informationen zu diesen Ausgabefeldern finden Sie DetectEntitiesin der Amazon Comprehend API-Referenz
Das folgende Beispiel zeigt die Ausgabe für ein einseitiges natives PDF-Eingabedokument.
Beispielausgabe einer benutzerdefinierten Entitätserkennungsanalyse eines PDF-Dokuments
{
"Blocks":
[
{
"BlockType": "LINE",
"Geometry":
{
"BoundingBox":
{
"Height": 0.012575757575757575,
"Left": 0.0,
"Top": 0.0015063131313131314,
"Width": 0.02262091503267974
},
"Polygon":
[
{
"X": 0.0,
"Y": 0.0015063131313131314
},
{
"X": 0.02262091503267974,
"Y": 0.0015063131313131314
},
{
"X": 0.02262091503267974,
"Y": 0.014082070707070706
},
{
"X": 0.0,
"Y": 0.014082070707070706
}
]
},
"Id": "4330efed-6334-4fc4-ba48-e050afa95c8d",
"Page": 1,
"Relationships":
[
{
"ids":
[
"f343ce48-583d-4abe-b84b-a232e266450f"
],
"type": "CHILD"
}
],
"Text": "S-3"
},
{
"BlockType": "WORD",
"Geometry":
{
"BoundingBox":
{
"Height": 0.012575757575757575,
"Left": 0.0,
"Top": 0.0015063131313131314,
"Width": 0.02262091503267974
},
"Polygon":
[
{
"X": 0.0,
"Y": 0.0015063131313131314
},
{
"X": 0.02262091503267974,
"Y": 0.0015063131313131314
},
{
"X": 0.02262091503267974,
"Y": 0.014082070707070706
},
{
"X": 0.0,
"Y": 0.014082070707070706
}
]
},
"Id": "f343ce48-583d-4abe-b84b-a232e266450f",
"Page": 1,
"Relationships":
[],
"Text": "S-3"
}
],
"DocumentMetadata":
{
"PageNumber": 1,
"Pages": 1
},
"DocumentType": "NativePDF",
"Entities":
[
{
"BlockReferences":
[
{
"BeginOffset": 25,
"BlockId": "4330efed-6334-4fc4-ba48-e050afa95c8d",
"ChildBlocks":
[
{
"BeginOffset": 1,
"ChildBlockId": "cbba5534-ac69-4bc4-beef-306c659f70a6",
"EndOffset": 6
}
],
"EndOffset": 30
}
],
"Score": 0.9998825926329088,
"Text": "0.001",
"Type": "OFFERING_PRICE"
},
{
"BlockReferences":
[
{
"BeginOffset": 41,
"BlockId": "f343ce48-583d-4abe-b84b-a232e266450f",
"ChildBlocks":
[
{
"BeginOffset": 0,
"ChildBlockId": "292a2e26-21f0-401b-a2bf-03aa4c47f787",
"EndOffset": 9
}
],
"EndOffset": 50
}
],
"Score": 0.9809727537330395,
"Text": "6,097,560",
"Type": "OFFERED_SHARES"
}
],
"File": "example.pdf",
"Version": "2021-04-30"
}