기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
AnalyzeExpense
텍스트 간의 재정적으로 관련된 관계에 대한 입력 문서를 동기적으로 분석합니다.
정보는 다음과 같이 반환됩니다.ExpenseDocuments
다음과 같이 분리됩니다.
-
LineItemGroups
- 다음을 포함하는 데이터 세트LineItems
구매한 품목과 영수증에 가격 등 텍스트 줄에 대한 정보를 저장합니다. -
SummaryFields
- 헤더 정보 또는 공급업체 이름과 같은 영수증에 다른 모든 정보가 들어 있습니다.
요청 구문
{
"Document": {
"Bytes": blob
,
"S3Object": {
"Bucket": "string
",
"Name": "string
",
"Version": "string
"
}
}
}
요청 파라미터
요청은 JSON 형식의 다음 데이터를 받습니다.
- Document
-
입력 문서 (바이트 또는 S3 객체) 입니다.
를 사용하여 Amazon Textract API 작업에 이미지 바이트를 전달합니다.
Bytes
속성입니다. 예를 들어 를 사용합니다.Bytes
로컬 파일 시스템에서 로드된 문서를 전달하는 속성입니다. 를 사용하여 전달된 이미지 바이트Bytes
속성입니다 base64로 인코딩해야 합니다. AWS SDK를 사용하여 Amazon Textract API 작업을 호출하는 경우 코드가 문서 파일 바이트를 인코딩하지 않아도 될 수 있습니다.다음을 사용하여 S3 버킷에 저장된 이미지를 Amazon Textract API 작업으로 전달합니다.
S3Object
속성입니다. S3 버킷에 저장된 문서는 base64로 인코딩할 필요가 없습니다.S3 객체가 있는 S3 버킷의 AWS 리전과 Amazon Textract 작업에 사용하는 AWS 리전이 일치해야 합니다.
AWS CLI를 사용하여 Amazon Textract 작업을 호출하는 경우 바이트 속성을 사용하여 이미지 바이트를 전달하는 작업은 지원되지 않습니다. 먼저 문서를 Amazon S3 버킷에 업로드한 다음 S3Object 속성을 사용하여 작업을 호출해야 합니다.
Amazon Textract Textract가 S3 객체를 처리하려면 사용자에게 S3 객체에 액세스할 수 있는 권한이 있어야 합니다.
유형: Document 객체
: 필수 프로세스는 페이지 쓰기 후 세그먼트화된 가장 오래전에 사용된(SLRU) 데이터가 내구성 있는 스토리지에 도달할 때까지 기다리고 있습니다.
응답 구문
{
"DocumentMetadata": {
"Pages": number
},
"ExpenseDocuments": [
{
"ExpenseIndex": number,
"LineItemGroups": [
{
"LineItemGroupIndex": number,
"LineItems": [
{
"LineItemExpenseFields": [
{
"LabelDetection": {
"Confidence": number,
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Text": "string"
},
"PageNumber": number,
"Type": {
"Confidence": number,
"Text": "string"
},
"ValueDetection": {
"Confidence": number,
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Text": "string"
}
}
]
}
]
}
],
"SummaryFields": [
{
"LabelDetection": {
"Confidence": number,
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Text": "string"
},
"PageNumber": number,
"Type": {
"Confidence": number,
"Text": "string"
},
"ValueDetection": {
"Confidence": number,
"Geometry": {
"BoundingBox": {
"Height": number,
"Left": number,
"Top": number,
"Width": number
},
"Polygon": [
{
"X": number,
"Y": number
}
]
},
"Text": "string"
}
}
]
}
]
}
응답 요소
작업이 성공하면 서비스가 HTTP 200 응답을 다시 전송합니다.
다음 데이터는 서비스에 의해 JSON 형식으로 반환됩니다.
- DocumentMetadata
-
입력 문서에 대한 정보입니다.
유형: DocumentMetadata 객체
- ExpenseDocuments
-
Amazon Textract Textract에서 감지한 비용입니다.
Type: 배열ExpenseDocument사물
오류
- AccessDeniedException
-
작업을 수행할 권한이 없습니다. 권한 있는 사용자 또는 IAM 역할의 Amazon 리소스 이름(ARN)을 사용하여 작업을 수행하십시오.
HTTP 상태 코드: 400
- BadDocumentException
-
Amazon Textract Textract는 문서를 읽을 수 없습니다. Amazon Textract Textract의 문서 한도에 대한 자세한 내용은 단원을 참조하십시오.Amazon Textract TEXTRACT에서의 하드 제한.
HTTP 상태 코드: 400
- DocumentTooLargeException
-
문서가 너무 크기 때문에 처리할 수 없습니다. 동기 작업의 최대 문서 크기입니다. 10MB 비동기 작업의 최대 문서 크기는 PDF 파일의 경우 500MB입니다.
HTTP 상태 코드: 400
- InternalServerError
-
Amazon Textract Textract에 서비스 문제가 발생했습니다. 호출을 다시 시도하십시오.
HTTP 상태 코드: 500
- InvalidParameterException
-
입력 파라미터가 제약 조건을 위반했습니다. 예를 들어, 동기 작업에서는
InvalidParameterException
예외가 발생하지 않을 때S3Object
또는Bytes
값은 다음 위치에 제공됩니다.Document
요청 파라미터입니다. 파라미터를 확인한 다음 API 작업을 다시 호출하십시오.HTTP 상태 코드: 400
- InvalidS3ObjectException
-
Amazon Textract Textract가 요청에서 지정된 S3 객체에 액세스할 수 없습니다. 자세한 내용은Amazon S3 대한 액세스 구성문제 해결 정보는 를 참조하십시오.Amazon S3 문제 해결
HTTP 상태 코드: 400
- ProvisionedThroughputExceededException
-
요청의 수가 처리량 한도를 초과했습니다. 이 한도를 늘려야 하는 경우 Amazon Textract Textract에 문의하십시오.
HTTP 상태 코드: 400
- ThrottlingException
-
Amazon Textract Textract가 요청을 일시적으로 처리할 수 없습니다. 호출을 다시 시도하십시오.
HTTP 상태 코드: 500
- UnsupportedDocumentException
-
출력 문서의 형식은 지원되지 않습니다. 작업 문서는 PNG, JPEG, PDF 또는 TIFF 형식일 수 있습니다.
HTTP 상태 코드: 400
참고 항목
이 API를 언어별 AWS SDK 중 하나로 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.