기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Block
ABlock
는 서로 가까운 픽셀 그룹 내의 문서에서 인식되는 항목을 나타냅니다. 에서 반환되는 정보Block
객체는 작업 유형에 따라 다릅니다. 문서에 대한 텍스트 감지 (예:DetectDocumentText) 를 선택하면 검색된 단어와 텍스트 줄에 대한 정보를 얻을 수 있습니다. 텍스트 분석 (예:AnalyzeDocument) 을 사용하면 문서에서 검색된 필드, 테이블 및 선택 요소에 대한 정보도 얻을 수 있습니다.
의 어레이Block
객체는 동기 및 비동기 작업 모두에 의해 반환됩니다. 동기식 작업 (예:DetectDocumentText의 배열Block
객체는 전체 결과 집합입니다. 비동기 작업 (예:GetDocumentAnalysis를 선택하면 하나 이상의 응답을 통해 배열이 반환됩니다.
자세한 내용은 단원을 참조하십시오.Amazon Textract 작동 방식.
목차
- BlockType
-
인식되는 텍스트 항목의 유형입니다. 텍스트 감지 작업에서 다음 유형이 반환됩니다.
-
페이지- LINE 목록이 포함되어 있습니다.
Block
문서 페이지에서 감지된 개체입니다. -
단어- 문서 페이지에서 감지된 단어입니다. 단어는 공백으로 구분되지 않은 하나 이상의 ISO 기본 라틴 스크립트 문자입니다.
-
선- 문서 페이지에서 감지되는 탭으로 구분된 연속 단어 문자열입니다.
텍스트 분석 작업에서는 다음 유형이 반환됩니다.
-
페이지- 하위 목록이 포함되어 있습니다.
Block
문서 페이지에서 감지된 개체입니다. -
키_값_세트- 키 및 가치 저장
Block
문서 페이지에서 감지된 링크된 텍스트의 개체입니다. 사용EntityType
KEY_VALUE_SET 객체가 키인지 확인하는 필드Block
객체 또는 값Block
객체입니다. -
단어- 문서 페이지에서 감지된 단어입니다. 단어는 공백으로 구분되지 않은 하나 이상의 ISO 기본 라틴 스크립트 문자입니다.
-
선- 문서 페이지에서 감지되는 탭으로 구분된 연속 단어 문자열입니다.
-
표- 문서 페이지에서 감지된 테이블입니다. 테이블은 두 개 이상의 행이나 열이 있는 그리드 기반 정보로, 셀 범위는 한 행과 각각 하나의 열로 구성됩니다.
-
세포- 감지된 테이블 내의 셀입니다. 셀은 셀의 텍스트를 포함하는 블록의 상위입니다.
-
선택_요소- 옵션 버튼 (라디오 버튼) 또는 문서 페이지에서 감지된 확인란과 같은 선택 요소 다음 값을 사용합니다.
SelectionStatus
선택 요소의 상태를 확인할 수 있습니다.
Type: String
유효한 값:
KEY_VALUE_SET | PAGE | LINE | WORD | TABLE | CELL | SELECTION_ELEMENT
: 필수 아니요
-
- ColumnIndex
-
테이블 셀이 나타나는 열입니다. 첫 번째 열 위치는 1입니다.
ColumnIndex
는 반환되지 않습니다.DetectDocumentText
과GetDocumentTextDetection
.Type: 정수
유효한 범위: 최소값 0.
: 필수 아니요
- ColumnSpan
-
테이블 셀이 걸쳐있는 열 수입니다. 현재 이 값은 스팬된 열 수가 1보다 큰 경우에도 항상 1입니다.
ColumnSpan
는 반환되지 않습니다.DetectDocumentText
과GetDocumentTextDetection
.Type: 정수
유효한 범위: 최소값 0.
: 필수 아니요
- Confidence
-
인식된 텍스트의 정확도와 인식된 텍스트 주위의 지오메트리 포인트의 정확성에 대해 Amazon Textract Textract의 신뢰도 점수입니다.
Type: 부동 소수점
유효한 범위: 최소값 0. 최대값 100입니다.
: 필수 아니요
- EntityTypes
-
엔터티의 유형입니다. 다음을 반환할 수 있습니다.
-
키- 문서의 필드에 대한 식별자입니다.
-
값- 필드 텍스트입니다.
EntityTypes
는 반환되지 않습니다.DetectDocumentText
과GetDocumentTextDetection
.Type: 문자열 배열
유효한 값:
KEY | VALUE
: 필수 아니요
-
- Geometry
-
이미지에서 인식된 텍스트의 위치입니다. 여기에는 텍스트를 둘러싸는 축 정렬된 거친 경계 상자와 보다 정확한 공간 정보를 위한 미세한 다각형이 포함되어 있습니다.
유형: Geometry 객체
: 필수 아니요
- Id
-
인식된 텍스트의 식별자입니다. 식별자는 단일 작업에 대해서만 고유합니다.
Type: String
Pattern:
.*\S.*
: 필수 아니요
- Page
-
블록이 감지된 페이지입니다.
Page
는 비동기 작업에 의해 반환됩니다. 1보다 큰 페이지 값은 PDF 또는 TIFF 형식의 여러 페이지 문서에 대해서만 반환됩니다. 스캔한 이미지 (JPEG/PNG) 는 여러 문서 페이지가 포함되어 있더라도 단일 페이지 문서로 간주됩니다. 의 가치Page
는 항상 1입니다. 동기식 작업이 반환되지 않음Page
모든 입력 문서는 단일 페이지 문서로 간주되기 때문입니다.Type: 정수
유효한 범위: 최소값 0.
: 필수 아니요
- Relationships
-
현재 블록의 하위 블록 목록입니다. 예를 들어 LINE 객체에는 텍스트 줄의 일부인 각 WORD 블록에 대한 하위 블록이 있습니다. 현재 블록에 하위 블록이 없는 경우와 같이 존재하지 않는 관계에 대한 관계 객체가 목록에 없습니다. 목록 크기는 다음과 같습니다.
-
0 - 블록에 하위 블록이 없습니다.
-
1 - 블록에 하위 블록이 있습니다.
Type: 배열Relationship사물
: 필수 아니요
-
- RowIndex
-
테이블 셀이 있는 행입니다. 첫 번째 행 위치는 1입니다.
RowIndex
는 반환되지 않습니다.DetectDocumentText
과GetDocumentTextDetection
.Type: 정수
유효한 범위: 최소값 0.
: 필수 아니요
- RowSpan
-
테이블 셀의 행 수입니다. 현재 이 값은 스팬된 행 수가 1보다 크더라도 항상 1입니다.
RowSpan
는 반환되지 않습니다.DetectDocumentText
과GetDocumentTextDetection
.Type: 정수
유효한 범위: 최소값 0.
: 필수 아니요
- SelectionStatus
-
옵션 버튼이나 확인란과 같은 선택 요소의 선택 상태입니다.
Type: String
유효한 값:
SELECTED | NOT_SELECTED
: 필수 아니요
- Text
-
Amazon Textract Textract에서 인식하는 단어 또는 텍스트 행입니다.
Type: String
: 필수 아니요
- TextType
-
Amazon Textract Textract가 감지한 텍스트의 종류입니다. 필기 텍스트와 인쇄된 텍스트를 확인할 수 있습니다.
Type: String
유효한 값:
HANDWRITING | PRINTED
: 필수 아니요
참고 항목
이 API를 언어별 AWS SDK 중 하나로 사용하는 방법에 대한 자세한 내용은 다음을 참조하세요.