기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
GetDocumentAnalysis
문서의 텍스트를 분석하는 Amazon Textract 비동기 작업의 결과를 가져옵니다.
다음을 호출하여 비동기 텍스트 분석을 시작합니다.StartDocumentAnalysis를 반환하는 작업 식별자 (JobId
). 텍스트 분석 작업이 완료되면 Amazon Textract Textract는 초기 호출에 등록된 Amazon Simple Notification Service (Amazon SNS) 주제에 완료 상태를 게시합니다.StartDocumentAnalysis
. 텍스트 감지 작업의 결과를 얻으려면 먼저 Amazon SNS 주제에 게시된 상태 값이 다음과 같은지 확인하십시오.SUCCEEDED
. 그렇다면 전화하십시오.GetDocumentAnalysis
작업 식별자를 전달하고 (JobId
) 초기 통화부터StartDocumentAnalysis
.
GetDocumentAnalysis
의 배열을 반환합니다.Block객체. 다음 정보 유형이 반환됩니다.
-
양식 데이터 (키-값 쌍). 관련 정보는 2개로 반환됩니다.Block객체, 각 유형
KEY_VALUE_SET
: 키Block
객체 및 값Block
객체. 예,이름: 아나 실바 캐롤라이나에는 키와 값이 포함되어 있습니다. 이름:열쇠입니다. 아나 실바 캐롤라이나이 값입니다. -
테이블 및 테이블 셀 데이터입니다. 테이블
Block
객체에는 탐지된 테이블에 대한 정보가 들어 있습니다. 셀Block
테이블의 각 셀에 대해 객체가 반환됩니다. -
줄 및 텍스트 단어. 줄 바꿈
Block
객체가 하나 이상의 WORD가 포함되어 있습니다.Block
객체. 문서에서 감지된 모든 줄과 단어가 반환됩니다 (텍스트 포함).StartDocumentAnalysis
FeatureTypes
입력 매개 변수).
확인란 및 옵션 버튼 (라디오 버튼) 과 같은 선택 요소는 양식 데이터 및 테이블에서 감지할 수 있습니다. 셀렉션_엘리먼트Block
객체에는 선택 상태를 포함하여 선택 요소에 대한 정보가 들어 있습니다.
사용MaxResults
파라미터를 사용하여 반환되는 블록 수를 제한합니다. 에 지정된 것보다 많은 결과가 있는 경우MaxResults
, 의 가치NextToken
작업 응답에는 다음 결과 집합을 가져오기 위한 페이지 지정 토큰이 포함되어 있습니다. 결과의 다음 페이지를 가져오려면GetDocumentAnalysis
를 채우고NextToken
이전 호출에서 반환된 토큰 값이 있는 요청 매개 변수GetDocumentAnalysis
.
자세한 내용은 단원을 참조하십시오.문서 텍스트 분석.
요청 구문
{
"JobId": "string
",
"MaxResults": number
,
"NextToken": "string
"
}
요청 파라미터
요청은 JSON 형식의 다음 데이터를 받습니다.
- JobId
-
텍스트 감지 작업의 고유 식별자입니다. 이
JobId
에서 반환됩니다.StartDocumentAnalysis
. AJobId
값은 7일 동안만 유효합니다.Type: String
길이 제약 조건: 최소 길이는 1이고, 최대 길이 64.
Pattern:
^[a-zA-Z0-9-_]+$
: 필수 프로세스는 페이지 쓰기 후 세그먼트화된 가장 오래전에 사용된(SLRU) 데이터가 내구성 있는 스토리지에 도달할 때까지 기다리고 있습니다.
- MaxResults
-
페이지가 지정된 호출당 반환할 최대 결과 수입니다. 지정할 수 있는 가장 큰 값은 1,000입니다. 1,000보다 큰 값을 지정한 경우 최대 1,000개의 결과가 반환됩니다. 기본값은 1000입니다.
Type: 정수
유효 범위: 최소값 1.
: 필수 아니요
- NextToken
-
이전 응답이 불완전한 경우 (검색할 블록이 더 많기 때문에) Amazon Textract Textract는 응답에 페이지 매김 토큰을 반환합니다. 이 페이지 매김 토큰을 사용하여 다음 블록 세트를 검색할 수 있습니다.
Type: String
길이 제약 조건: 최소 길이는 1이고, 최대 길이 255.
Pattern:
.*\S.*
: 필수 아니요
응답 구문
{
"AnalyzeDocumentModelVersion": "string",
"Blocks": [
{
"BlockType": "string",
"ColumnIndex": number,
"ColumnSpan": number,
"Confidence": number,
"EntityTypes": [ "string" ],
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Id": "string",
"Page": number,
"Relationships": [
{
"Ids": [ "string" ],
"Type": "string"
}
],
"RowIndex": number,
"RowSpan": number,
"SelectionStatus": "string",
"Text": "string",
"TextType": "string"
}
],
"DocumentMetadata": {
"Pages": number
},
"JobStatus": "string",
"NextToken": "string",
"StatusMessage": "string",
"Warnings": [
{
"ErrorCode": "string",
"Pages": [ number ]
}
]
}
응답 요소
작업이 성공하면 서비스가 HTTP 200 응답을 다시 전송합니다.
다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.
- AnalyzeDocumentModelVersion
-
Type: String
- Blocks
-
텍스트 분석 작업의 결과입니다.
Type: 배열Block사물
- DocumentMetadata
-
Amazon Textract Textract가 처리한 문서에 대한 정보입니다.
DocumentMetadata
는 Amazon Textract 비디오 작업에서 페이지 매겨진 응답의 모든 페이지에서 반환됩니다.유형: DocumentMetadata 객체
- JobStatus
-
텍스트 검색 작업의 현재 상태입니다.
Type: String
유효한 값:
IN_PROGRESS | SUCCEEDED | FAILED | PARTIAL_SUCCESS
- NextToken
-
응답이 잘린 경우 Amazon Textract Textract는 이 토큰을 반환합니다. 이 토큰을 후속 요청에서 사용하여 다음 텍스트 검색 결과 집합을 가져올 수 있습니다.
Type: String
길이 제약 조건: 최소 길이는 1이고, 최대 길이 255.
Pattern:
.*\S.*
- StatusMessage
-
검색 작업을 완료할 수 없는 경우 반환합니다. 발생한 오류에 대한 설명이 들어 있습니다.
Type: String
- Warnings
-
문서 분석 작업 중에 발생한 경고 목록입니다.
Type: 배열Warning사물
오류
- AccessDeniedException
-
작업을 수행할 권한이 없습니다. 권한 있는 사용자 또는 IAM 역할의 Amazon 리소스 이름(ARN)을 사용하여 작업을 수행하십시오.
HTTP 상태 코드: 400
- InternalServerError
-
Amazon Textract Textract에 서비스 문제가 발생했습니다. 호출을 다시 시도하십시오.
HTTP 상태 코드: 500
- InvalidJobIdException
-
잘못된 작업 식별자가 에 전달되었습니다.GetDocumentAnalysis또는GetDocumentAnalysis.
HTTP 상태 코드: 400
- InvalidKMSKeyException
-
KMS 키를 입력한 상태에서 암호 해독 권한이 없거나 KMS 키가 잘못 입력되었음을 나타냅니다.
HTTP 상태 코드: 400
- InvalidParameterException
-
입력 파라미터가 제약 조건을 위반했습니다. 예를 들어, 동기 작업에서는
InvalidParameterException
예외가 발생하지 않을 때S3Object
또는Bytes
값은 다음 위치에 제공됩니다.Document
요청 파라미터입니다. 파라미터를 확인한 다음 API 작업을 다시 호출하십시오.HTTP 상태 코드: 400
- InvalidS3ObjectException
-
Amazon Textract 이 요청에서 지정된 S3 객체에 액세스할 수 없습니다. 자세한 내용은Amazon S3 액세스 구성문제 해결 정보는 를 참조하십시오.Amazon S3 문제 해결
HTTP 상태 코드: 400
- ProvisionedThroughputExceededException
-
요청의 수가 처리량 한도를 초과했습니다. 이 한도를 늘려야 하는 경우 Amazon Textract Textract에 문의하십시오.
HTTP 상태 코드: 400
- ThrottlingException
-
Amazon Textract 이 요청을 일시적으로 처리할 수 없습니다. 호출을 다시 시도하십시오.
HTTP 상태 코드: 500
참고 항목
이 API를 언어별 AWS SDK 중 하나로 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.