기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
GetDocumentTextDetection
문서에서 텍스트를 감지하는 Amazon Textract 비동기 작업에 대한 결과를 가져옵니다. Amazon Textract Textract는 텍스트 줄과 텍스트 한 줄을 구성하는 단어를 감지할 수 있습니다.
를 호출하여 비동기 텍스트 감지를 시작합니다.StartDocumentTextDetection를 반환하는 작업 식별자 (JobId
). 텍스트 검색 작업이 완료되면 Amazon Textract Textract는 초기 호출에 등록된 Amazon Simple Notification Service (Amazon SNS) 주제에 완료 상태를 게시합니다.StartDocumentTextDetection
. 텍스트 감지 작업의 결과를 얻으려면 먼저 Amazon SNS 주제에 게시된 상태 값이 다음과 같은지 확인하십시오.SUCCEEDED
. 그렇다면 전화하십시오.GetDocumentTextDetection
작업 식별자를 전달하고 (JobId
) 초기 통화부터StartDocumentTextDetection
.
GetDocumentTextDetection
의 배열을 반환합니다.Block객체.
각 문서 페이지는 연결된 상태로Block
페이지 유형입니다. 각 페이지Block
객체가 LINE에 있는 상위Block
페이지에서 감지된 텍스트 행을 나타내는 개체입니다. 줄 바꿈Block
object는 선을 구성하는 각 단어의 부모입니다. 단어는 다음과 같이 표시됩니다.Block
WORD 유형의 객체입니다.
MaxResulent 파라미터를 사용하여 반환되는 블록 수를 제한합니다. 에 지정된 것보다 많은 결과가 있는 경우MaxResults
, 의 가치NextToken
작업 응답에 다음 결과 집합을 가져오기 위한 페이지 매김 토큰이 포함되어 있습니다. 결과의 다음 페이지를 가져오려면GetDocumentTextDetection
를 채우고NextToken
이전 호출에서 반환된 토큰 값이 있는 요청 매개 변수GetDocumentTextDetection
.
자세한 내용은 단원을 참조하십시오.문서 텍스트 감지.
요청 구문
{
"JobId": "string
",
"MaxResults": number
,
"NextToken": "string
"
}
요청 파라미터
요청은 JSON 형식의 다음 데이터를 받습니다.
- JobId
-
텍스트 감지 작업의 고유 식별자입니다. 이
JobId
에서 반환됩니다.StartDocumentTextDetection
. AJobId
값은 7일 동안만 유효합니다.Type: String
길이 제약 조건: 최소 길이는 1이고, 최대 길이 64.
Pattern:
^[a-zA-Z0-9-_]+$
: 필수 프로세스는 페이지 쓰기 후 세그먼트화된 가장 오래전에 사용된(SLRU) 데이터가 내구성 있는 스토리지에 도달할 때까지 기다리고 있습니다.
- MaxResults
-
페이지가 지정된 호출당 반환할 결과의 최대 수입니다. 지정할 수 있는 가장 큰 값은 1,000입니다. 1,000보다 큰 값을 지정한 경우 최대 1,000개의 결과가 반환됩니다. 기본값은 1000입니다.
Type: 정수
유효 범위: 최소값 1.
: 필수 아니요
- NextToken
-
이전 응답이 불완전한 경우 (검색할 블록이 더 많기 때문에) Amazon Textract Textract는 응답에 페이지 매김 토큰을 반환합니다. 이 페이지 매김 토큰을 사용하여 다음 블록 세트를 검색할 수 있습니다.
Type: String
길이 제약 조건: 최소 길이는 1이고, 최대 길이 255.
Pattern:
.*\S.*
: 필수 아니요
응답 구문
{
"Blocks": [
{
"BlockType": "string",
"ColumnIndex": number,
"ColumnSpan": number,
"Confidence": number,
"EntityTypes": [ "string" ],
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Id": "string",
"Page": number,
"Relationships": [
{
"Ids": [ "string" ],
"Type": "string"
}
],
"RowIndex": number,
"RowSpan": number,
"SelectionStatus": "string",
"Text": "string",
"TextType": "string"
}
],
"DetectDocumentTextModelVersion": "string",
"DocumentMetadata": {
"Pages": number
},
"JobStatus": "string",
"NextToken": "string",
"StatusMessage": "string",
"Warnings": [
{
"ErrorCode": "string",
"Pages": [ number ]
}
]
}
응답 요소
작업이 성공하면 서비스가 HTTP 200 응답을 다시 전송합니다.
다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.
- Blocks
-
텍스트 감지 작업의 결과입니다.
Type: 배열Block사물
- DetectDocumentTextModelVersion
-
Type: String
- DocumentMetadata
-
Amazon Textract Textract가 처리한 문서에 대한 정보입니다.
DocumentMetadata
는 Amazon Textract 비디오 작업에서 페이지 매겨진 응답의 모든 페이지에서 반환됩니다.유형: DocumentMetadata 객체
- JobStatus
-
텍스트 검색 작업의 현재 상태입니다.
Type: String
유효한 값:
IN_PROGRESS | SUCCEEDED | FAILED | PARTIAL_SUCCESS
- NextToken
-
응답이 잘린 경우 Amazon Textract Textract는 이 토큰을 반환합니다. 후속 요청에서 이 토큰을 사용하여 다음 텍스트 감지 결과 집합을 가져올 수 있습니다.
Type: String
길이 제약 조건: 최소 길이는 1이고, 최대 길이 255.
Pattern:
.*\S.*
- StatusMessage
-
검색 작업을 완료할 수 없는 경우 반환합니다. 발생한 오류에 대한 설명이 들어 있습니다.
Type: String
- Warnings
-
문서에 대한 텍스트 감지 작업 중에 발생한 경고 목록입니다.
Type: 배열Warning사물
오류
- AccessDeniedException
-
작업을 수행할 권한이 없습니다. 권한 있는 사용자 또는 IAM 역할의 Amazon 리소스 이름(ARN)을 사용하여 작업을 수행하십시오.
HTTP 상태 코드: 400
- InternalServerError
-
Amazon Textract Textract에 서비스 문제가 발생했습니다. 호출을 다시 시도하십시오.
HTTP 상태 코드: 500
- InvalidJobIdException
-
잘못된 작업 식별자가 에 전달되었습니다.GetDocumentAnalysis또는GetDocumentAnalysis.
HTTP 상태 코드: 400
- InvalidKMSKeyException
-
KMS 키를 입력한 상태에서 암호 해독 권한이 없거나 KMS 키가 잘못 입력되었음을 나타냅니다.
HTTP 상태 코드: 400
- InvalidParameterException
-
입력 파라미터가 제약 조건을 위반했습니다. 예를 들어, 동기 작업에서는
InvalidParameterException
예외가 발생하지 않을 때S3Object
또는Bytes
값은 다음 위치에 제공됩니다.Document
요청 파라미터입니다. 파라미터를 확인한 다음 API 작업을 다시 호출하십시오.HTTP 상태 코드: 400
- InvalidS3ObjectException
-
Amazon Textract TExtract이 요청에서 지정된 S3 객체에 액세스할 수 없습니다. 자세한 내용은Amazon S3 대한 액세스 구성문제 해결 정보는 를 참조하십시오.Amazon S3 문제 해결
HTTP 상태 코드: 400
- ProvisionedThroughputExceededException
-
요청의 수가 처리량 한도를 초과했습니다. 이 한도를 늘려야 하는 경우 Amazon Textract Textract에 문의하십시오.
HTTP 상태 코드: 400
- ThrottlingException
-
Amazon Textract Textract이 요청을 일시적으로 처리할 수 없습니다. 호출을 다시 시도하십시오.
HTTP 상태 코드: 500
참고 항목
이 API를 언어별 AWS SDK 중 하나로 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.