텍스트 감지 및 문서 분석 응답 객체 - Amazon Textract

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

텍스트 감지 및 문서 분석 응답 객체

Amazon Textract Textract가 문서를 처리할 때 다음과 같은 목록을 생성합니다.Block탐지되거나 분석된 텍스트의 개체입니다. 각 블록에는 탐지된 아이템, 위치 및 Amazon Textract Textract가 처리의 정확성에 대한 확신에 대한 정보가 포함되어 있습니다.

문서는 다음과 같은 유형으로 구성됩니다.Block객체입니다.

블록의 내용은 호출하는 작업에 따라 다릅니다. 텍스트 감지 작업 중 하나를 호출하면 검색된 텍스트의 페이지, 줄 및 단어가 반환됩니다. 자세한 정보는 텍스트 감지을 참조하십시오. 문서 분석 작업 중 하나를 호출하면 검색된 페이지, 키-값 쌍, 테이블, 선택 요소 및 텍스트에 대한 정보가 반환됩니다. 자세한 정보는 문서 분석을 참조하십시오.

약간Block객체 필드는 두 유형의 처리에 공통적입니다. 예를 들어, 각 블록에는 고유한 식별자가 있습니다.

사용 방법을 보여주는 예제의 경우Block객체, 참조자습서.

문서 레이아웃

Amazon Textract Textract는 문서의 표현을 여러 유형의 목록으로 반환합니다.Block상위-하위 관계 또는 키-값 쌍으로 연결된 객체입니다. 문서의 페이지 수를 제공하는 메타데이터도 반환됩니다. 다음은 전형적인 JSON 입니다.Block형식의 객체PAGE.

{ "Blocks": [ { "Geometry": { "BoundingBox": { "Width": 1.0, "Top": 0.0, "Left": 0.0, "Height": 1.0 }, "Polygon": [ { "Y": 0.0, "X": 0.0 }, { "Y": 0.0, "X": 1.0 }, { "Y": 1.0, "X": 1.0 }, { "Y": 1.0, "X": 0.0 } ] }, "Relationships": [ { "Type": "CHILD", "Ids": [ "2602b0a6-20e3-4e6e-9e46-3be57fd0844b", "82aedd57-187f-43dd-9eb1-4f312ca30042", "52be1777-53f7-42f6-a7cf-6d09bdc15a30", "7ca7caa6-00ef-4cda-b1aa-5571dfed1a7c" ] } ], "BlockType": "PAGE", "Id": "8136b2dc-37c1-4300-a9da-6ed8b276ea97" }..... ], "DocumentMetadata": { "Pages": 1 } }

문서가 하나 이상에서 작성됩니다.PAGE블록을 지원합니다. 각 페이지에는 페이지에서 감지된 기본 항목 (예: 텍스트 및 표 줄) 에 대한 하위 블록 목록이 포함되어 있습니다. 자세한 정보는 페이지을 참조하십시오.

의 유형을 결정할 수 있습니다.Block객체를 검사하여BlockType필드.

ABlock객체가 관련 목록을 포함하고 있습니다.Block의 객체Relationships필드, 배열입니다.Relationship객체입니다. ARelationships배열은 CHILD 유형 또는 VALUE 유형입니다. CHILD 유형의 배열은 현재 블록의 하위인 항목을 나열하는 데 사용됩니다. 예를 들어, 현재 블록이 LINE 유형일 경우Relationships에는 텍스트 줄을 구성하는 WORD 블록의 ID 목록이 포함되어 있습니다. VALUE 유형의 배열은 키-값 페어를 포함하는 데 사용됩니다. 다음을 검사하여 관계 유형을 확인할 수 있습니다.Type의 필드Relationship객체입니다.

하위 블록에는 상위 블록 오브젝트에 대한 정보가 없습니다.

다음과 같은 예시Block정보는 단원을 참조하십시오.동기식 작업을 통한 문서 처리.

신뢰도

Amazon Textract 작업은 감지된 아이템의 정확성에 대해 Amazon Textract Textract가 가진 비율의 신뢰도를 반환합니다. 자신감을 얻으려면Confidence의 필드Block객체입니다. 값이 높을수록 신뢰도가 높아집니다. 시나리오에 따라 신뢰도가 낮은 탐지는 사람의 시각적 확인이 필요할 수 있습니다.

Geometry

Amazon Textract 작업은 자격 증명 분석을 제외하고 문서 페이지에서 탐지된 항목의 위치에 대한 위치 정보를 반환합니다. 위치를 가져오려면Geometry의 필드Block객체입니다. 자세한 내용은 단원을 참조하십시오.문서 페이지의 항목 위치