GetDocumentTextDetection - Amazon Textract

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

GetDocumentTextDetection

문서에서 텍스트를 감지하는 Amazon Textract 비동기 작업에 대한 결과를 가져옵니다. Amazon Textract Textract는 텍스트 줄과 텍스트 한 줄을 구성하는 단어를 감지할 수 있습니다.

를 호출하여 비동기 텍스트 감지를 시작합니다.StartDocumentTextDetection를 반환하는 작업 식별자 (JobId). 텍스트 검색 작업이 완료되면 Amazon Textract Textract는 초기 호출에 등록된 Amazon Simple Notification Service (Amazon SNS) 주제에 완료 상태를 게시합니다.StartDocumentTextDetection. 텍스트 감지 작업의 결과를 얻으려면 먼저 Amazon SNS 주제에 게시된 상태 값이 다음과 같은지 확인하십시오.SUCCEEDED. 그렇다면 전화하십시오.GetDocumentTextDetection작업 식별자를 전달하고 (JobId) 초기 통화부터StartDocumentTextDetection.

GetDocumentTextDetection의 배열을 반환합니다.Block객체.

각 문서 페이지는 연결된 상태로Block페이지 유형입니다. 각 페이지Block객체가 LINE에 있는 상위Block페이지에서 감지된 텍스트 행을 나타내는 개체입니다. 줄 바꿈Blockobject는 선을 구성하는 각 단어의 부모입니다. 단어는 다음과 같이 표시됩니다.BlockWORD 유형의 객체입니다.

MaxResulent 파라미터를 사용하여 반환되는 블록 수를 제한합니다. 에 지정된 것보다 많은 결과가 있는 경우MaxResults, 의 가치NextToken작업 응답에 다음 결과 집합을 가져오기 위한 페이지 매김 토큰이 포함되어 있습니다. 결과의 다음 페이지를 가져오려면GetDocumentTextDetection를 채우고NextToken이전 호출에서 반환된 토큰 값이 있는 요청 매개 변수GetDocumentTextDetection.

자세한 내용은 단원을 참조하십시오.문서 텍스트 감지.

요청 구문

{ "JobId": "string", "MaxResults": number, "NextToken": "string" }

요청 파라미터

요청은 JSON 형식의 다음 데이터를 받습니다.

JobId

텍스트 감지 작업의 고유 식별자입니다. 이JobId에서 반환됩니다.StartDocumentTextDetection. AJobId값은 7일 동안만 유효합니다.

Type: String

길이 제약 조건: 최소 길이는 1이고, 최대 길이 64.

Pattern: ^[a-zA-Z0-9-_]+$

: 필수 프로세스는 페이지 쓰기 후 세그먼트화된 가장 오래전에 사용된(SLRU) 데이터가 내구성 있는 스토리지에 도달할 때까지 기다리고 있습니다.

MaxResults

페이지가 지정된 호출당 반환할 결과의 최대 수입니다. 지정할 수 있는 가장 큰 값은 1,000입니다. 1,000보다 큰 값을 지정한 경우 최대 1,000개의 결과가 반환됩니다. 기본값은 1000입니다.

Type: 정수

유효 범위: 최소값 1.

: 필수 아니요

NextToken

이전 응답이 불완전한 경우 (검색할 블록이 더 많기 때문에) Amazon Textract Textract는 응답에 페이지 매김 토큰을 반환합니다. 이 페이지 매김 토큰을 사용하여 다음 블록 세트를 검색할 수 있습니다.

Type: String

길이 제약 조건: 최소 길이는 1이고, 최대 길이 255.

Pattern: .*\S.*

: 필수 아니요

응답 구문

{ "Blocks": [ { "BlockType": "string", "ColumnIndex": number, "ColumnSpan": number, "Confidence": number, "EntityTypes": [ "string" ], "Geometry": { "BoundingBox": { "Height": number, "Left": number, "Top": number, "Width": number }, "Polygon": [ { "X": number, "Y": number } ] }, "Id": "string", "Page": number, "Relationships": [ { "Ids": [ "string" ], "Type": "string" } ], "RowIndex": number, "RowSpan": number, "SelectionStatus": "string", "Text": "string", "TextType": "string" } ], "DetectDocumentTextModelVersion": "string", "DocumentMetadata": { "Pages": number }, "JobStatus": "string", "NextToken": "string", "StatusMessage": "string", "Warnings": [ { "ErrorCode": "string", "Pages": [ number ] } ] }

응답 요소

작업이 성공하면 서비스가 HTTP 200 응답을 다시 전송합니다.

다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.

Blocks

텍스트 감지 작업의 결과입니다.

Type: 배열Block사물

DetectDocumentTextModelVersion

Type: String

DocumentMetadata

Amazon Textract Textract가 처리한 문서에 대한 정보입니다.DocumentMetadata는 Amazon Textract 비디오 작업에서 페이지 매겨진 응답의 모든 페이지에서 반환됩니다.

유형: DocumentMetadata 객체

JobStatus

텍스트 검색 작업의 현재 상태입니다.

Type: String

유효한 값: IN_PROGRESS | SUCCEEDED | FAILED | PARTIAL_SUCCESS

NextToken

응답이 잘린 경우 Amazon Textract Textract는 이 토큰을 반환합니다. 후속 요청에서 이 토큰을 사용하여 다음 텍스트 감지 결과 집합을 가져올 수 있습니다.

Type: String

길이 제약 조건: 최소 길이는 1이고, 최대 길이 255.

Pattern: .*\S.*

StatusMessage

검색 작업을 완료할 수 없는 경우 반환합니다. 발생한 오류에 대한 설명이 들어 있습니다.

Type: String

Warnings

문서에 대한 텍스트 감지 작업 중에 발생한 경고 목록입니다.

Type: 배열Warning사물

오류

AccessDeniedException

작업을 수행할 권한이 없습니다. 권한 있는 사용자 또는 IAM 역할의 Amazon 리소스 이름(ARN)을 사용하여 작업을 수행하십시오.

HTTP 상태 코드: 400

InternalServerError

Amazon Textract Textract에 서비스 문제가 발생했습니다. 호출을 다시 시도하십시오.

HTTP 상태 코드: 500

InvalidJobIdException

잘못된 작업 식별자가 에 전달되었습니다.GetDocumentAnalysis또는GetDocumentAnalysis.

HTTP 상태 코드: 400

InvalidKMSKeyException

KMS 키를 입력한 상태에서 암호 해독 권한이 없거나 KMS 키가 잘못 입력되었음을 나타냅니다.

HTTP 상태 코드: 400

InvalidParameterException

입력 파라미터가 제약 조건을 위반했습니다. 예를 들어, 동기 작업에서는InvalidParameterException예외가 발생하지 않을 때S3Object또는Bytes값은 다음 위치에 제공됩니다.Document요청 파라미터입니다. 파라미터를 확인한 다음 API 작업을 다시 호출하십시오.

HTTP 상태 코드: 400

InvalidS3ObjectException

Amazon Textract TExtract이 요청에서 지정된 S3 객체에 액세스할 수 없습니다. 자세한 내용은Amazon S3 대한 액세스 구성문제 해결 정보는 를 참조하십시오.Amazon S3 문제 해결

HTTP 상태 코드: 400

ProvisionedThroughputExceededException

요청의 수가 처리량 한도를 초과했습니다. 이 한도를 늘려야 하는 경우 Amazon Textract Textract에 문의하십시오.

HTTP 상태 코드: 400

ThrottlingException

Amazon Textract Textract이 요청을 일시적으로 처리할 수 없습니다. 호출을 다시 시도하십시오.

HTTP 상태 코드: 500

참고 항목

이 API를 언어별 AWS SDK 중 하나로 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.