Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
GetDocumentTextDetection
Ruft die Ergebnisse für einen asynchronen Amazon Textract Textract-Vorgang ab, der Text in einem Dokument erkennt. Amazon Textract kann Textzeilen und Wörter erkennen, aus denen eine Textzeile besteht.
Sie starten die asynchrone Texterkennung durch AufrufenStartDocumentTextDetection, die eine Job-ID zurückgibt (JobId
) enthalten. Wenn der Vorgang zur Texterkennung abgeschlossen ist, veröffentlicht Amazon Textract einen Abschlussstatus für das Thema Amazon Simple Notification Service (Amazon SNS), das im ersten Aufruf von registriert istStartDocumentTextDetection
aus. Um die Ergebnisse des Texterkennungsvorgangs zu erhalten, überprüfen Sie zunächst, ob der im Amazon SNS SNS-Thema veröffentlichte Statuswert lautetSUCCEEDED
aus. Wenn ja, ruf anGetDocumentTextDetection
und übergeben Sie die Job-ID (JobId
) vom ersten Anruf anStartDocumentTextDetection
aus.
GetDocumentTextDetection
gibt ein Array vonBlock-Objekte.
Jede Dokumentseite ist als verknüpftBlock
vom Typ PAGE. Jede SEITEBlock
Objekt ist das übergeordnete Element von LINEBlock
-Objekte, die die Zeilen des erkannten Textes auf einer Seite darstellen. EINE ZEILEBlock
object ist ein übergeordnetes Element für jedes Wort, aus dem die Zeile besteht. Wörter werden dargestellt durchBlock
Objekte vom Typ WORD.
Verwenden Sie den MaxResults-Parameter, um die Anzahl der zurückgegebenen Blöcke einzuschränken. Wenn es mehr Ergebnisse gibt als in angegebenMaxResults
, der Wert vonNextToken
In der Betriebsantwort enthält ein Paginierungs-Token für den Abruf des nächsten Ergebnissatzes. Um die nächste Ergebnisseite abzurufen, rufen SieGetDocumentTextDetection
und bevölkernNextToken
Anforderungsparameter mit dem Token-Wert, der vom vorherigen Aufruf an zurückgegeben wurdeGetDocumentTextDetection
aus.
Weitere Informationen finden Sie unterErkennung von Text-Dokumentenaus.
Anforderungssyntax
{
"JobId": "string
",
"MaxResults": number
,
"NextToken": "string
"
}
Anfrageparameter
Die Anforderung akzeptiert die folgenden Daten im JSON-Format.
- JobId
-
Ein eindeutiger Bezeichner für den Texterkennungsauftrag. Die
JobId
wird zurückgegeben vonStartDocumentTextDetection
aus. EINJobId
Der Wert ist nur 7 Tage lang gültig.Type: String (Zeichenfolge)
Einschränkungen für die Länge: Mindestlänge 1. Höchstlänge = 64 Zeichen.
Pattern:
^[a-zA-Z0-9-_]+$
Erforderlich: Ja
- MaxResults
-
Die maximale Anzahl der Ergebnisse, die pro paginierten Aufruf zurückgegeben werden sollen. Der größte Wert, den Sie angeben können, ist 1.000. Wenn Sie einen größeren Wert als 1.000 angeben, wird die maximale Anzahl von 1.000 Ergebnissen zurückgegeben. Der Standardwert lautet 1.000.
Type: Ganzzahl
Gültiger Bereich: Der Mindestwert ist 1.
Erforderlich: Nein
- NextToken
-
Wenn die vorherige Antwort unvollständig war (da mehr Blöcke abgerufen werden müssen), gibt Amazon Textract ein Paginierungstoken in der Antwort zurück. Sie können dieses Paginierungs-Token verwenden, um den nächsten Satz von Blöcken abzurufen.
Type: String (Zeichenfolge)
Einschränkungen für die Länge: Mindestlänge 1. Höchstlänge = 255 Zeichen.
Pattern:
.*\S.*
Erforderlich: Nein
Antwortsyntax
{
"Blocks": [
{
"BlockType": "string",
"ColumnIndex": number,
"ColumnSpan": number,
"Confidence": number,
"EntityTypes": [ "string" ],
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Id": "string",
"Page": number,
"Relationships": [
{
"Ids": [ "string" ],
"Type": "string"
}
],
"RowIndex": number,
"RowSpan": number,
"SelectionStatus": "string",
"Text": "string",
"TextType": "string"
}
],
"DetectDocumentTextModelVersion": "string",
"DocumentMetadata": {
"Pages": number
},
"JobStatus": "string",
"NextToken": "string",
"StatusMessage": "string",
"Warnings": [
{
"ErrorCode": "string",
"Pages": [ number ]
}
]
}
Antwortelemente
Wenn die Aktion erfolgreich ist, sendet der Service eine HTTP 200-Antwort zurück.
Die folgenden Daten werden vom Service im JSON-Format zurückgegeben.
- Blocks
-
Die Ergebnisse des Texterkennungsvorgangs.
Type: Array vonBlockObjekte
- DetectDocumentTextModelVersion
-
Type: String (Zeichenfolge)
- DocumentMetadata
-
Informationen über ein Dokument, das Amazon Textract verarbeitet hat.
DocumentMetadata
wird auf jeder Seite mit paginierten Antworten eines Amazon Textract Textract-Videovorgangs zurückgegeben.Typ: DocumentMetadata Objekt
- JobStatus
-
Der aktuelle Status des Texterkennungsauftrags.
Type: String (Zeichenfolge)
Zulässige Werte:
IN_PROGRESS | SUCCEEDED | FAILED | PARTIAL_SUCCESS
- NextToken
-
Wenn die Antwort abgeschnitten wird, gibt Amazon Textract dieses Token zurück. Sie können dieses Token in der nachfolgenden Anforderung verwenden, um den nächsten Satz von Texterkennungs-Ergebnissen abzurufen.
Type: String (Zeichenfolge)
Einschränkungen für die Länge: Mindestlänge 1. Höchstlänge = 255 Zeichen.
Pattern:
.*\S.*
- StatusMessage
-
Gibt zurück, wenn der Erkennungsauftrag nicht abgeschlossen werden konnte. Enthält eine Erklärung dafür, welcher Fehler aufgetreten ist.
Type: String (Zeichenfolge)
- Warnings
-
Eine Liste der Warnungen, die während des Texterkennungsvorgangs für das Dokument aufgetreten sind.
Type: Array vonWarningObjekte
Fehler
- AccessDeniedException
-
Sie sind nicht berechtigt, die Aktion auszuführen. Verwenden Sie den Amazon-Ressourcennamen (ARN) der IAM-Rolle oder eines autorisierten Benutzers, um den Vorgang auszuführen.
HTTP-Statuscode: 400
- InternalServerError
-
Amazon Textract hat ein Service-Problem festgestellt. Wiederholen Sie den Aufruf.
HTTP-Statuscode: 500
- InvalidJobIdException
-
Eine ungültige Job-ID wurde übergeben anGetDocumentAnalysisoder zuGetDocumentAnalysisaus.
HTTP-Statuscode: 400
- InvalidKMSKeyException
-
Zeigt an, dass Sie keine Entschlüsselungsberechtigungen mit dem eingegebenen KMS-Schlüssel haben oder der KMS-Schlüssel falsch eingegeben wurde.
HTTP-Statuscode: 400
- InvalidParameterException
-
Ein Eingabeparameter verletzt eine Beschränkung. Zum Beispiel wird bei synchronen Operationen ein
InvalidParameterException
Ausnahme tritt auf, wenn keiner derS3Object
oderBytes
Werte werden imDocument
Anforderungsparameter. Validieren Sie den Parameter, bevor Sie den API-Vorgang erneut aufrufen.HTTP-Statuscode: 400
- InvalidS3ObjectException
-
Amazon Textract kann auf das in der Anforderung angegebene S3-Objekt nicht zugreifen.Konfigurieren des Zugriffs auf Amazon S3Informationen zur Problembehebung finden Sie unterFehlerbehebung für Amazon S3
HTTP-Statuscode: 400
- ProvisionedThroughputExceededException
-
Die Anzahl der Anforderungen hat das Durchsatzlimit überschritten. Wenn Sie dieses Limit erhöhen müssen, wenden Sie sich an Amazon Textract.
HTTP-Statuscode: 400
- ThrottlingException
-
Amazon Textract kann die Anforderung vorübergehend nicht verarbeiten. Wiederholen Sie den Aufruf.
HTTP-Statuscode: 500
Weitere Informationen finden Sie unter:
Weitere Informationen zur Verwendung dieser API in einem der sprachspezifischen AWS-SDKs finden Sie unter: