AWS CLI를 사용한 Amazon Textract 예시
다음 코드 예시는 Amazon Textract와 함께 AWS Command Line Interface를 사용하여 작업을 수행하고 일반적인 시나리오를 구현하는 방법을 보여줍니다.
작업은 대규모 프로그램에서 발췌한 코드이며 컨텍스트에 맞춰 실행해야 합니다. 작업은 관련 시나리오의 컨텍스트에 따라 표시되며, 개별 서비스 함수를 직접적으로 호출하는 방법을 보여줍니다.
각 예시에는 전체 소스 코드에 대한 링크가 포함되어 있으며, 여기에서 컨텍스트에 맞춰 코드를 설정하고 실행하는 방법에 대한 지침을 찾을 수 있습니다.
주제
작업
다음 코드 예시에서는 analyze-document
의 사용 방법을 보여줍니다.
- AWS CLI
-
문서 텍스트 분석
다음
analyze-document
예시에서는 문서에서 텍스트를 분석하는 방법을 보여줍니다.Linux/macOS:
aws textract analyze-document \ --document '
{"S3Object":{"Bucket":"bucket","Name":"document"}}
' \ --feature-types '["TABLES","FORMS"]
'Windows:
aws textract analyze-document \ --document "{\"S3Object\":{\"Bucket\":\"bucket\",\"Name\":\"document\"}}" \ --feature-types "[\"TABLES\",\"FORMS\"]" \ --region
region-name
출력:
{ "Blocks": [ { "Geometry": { "BoundingBox": { "Width": 1.0, "Top": 0.0, "Left": 0.0, "Height": 1.0 }, "Polygon": [ { "Y": 0.0, "X": 0.0 }, { "Y": 0.0, "X": 1.0 }, { "Y": 1.0, "X": 1.0 }, { "Y": 1.0, "X": 0.0 } ] }, "Relationships": [ { "Type": "CHILD", "Ids": [ "87586964-d50d-43e2-ace5-8a890657b9a0", "a1e72126-21d9-44f4-a8d6-5c385f9002ba", "e889d012-8a6b-4d2e-b7cd-7a8b327d876a" ] } ], "BlockType": "PAGE", "Id": "c2227f12-b25d-4e1f-baea-1ee180d926b2" } ], "DocumentMetadata": { "Pages": 1 } }
자세한 내용은 Amazon Textract 개발자 안내서의 Amazon Textract로 문서 텍스트 분석을 참조하세요.
-
API 세부 정보는 AWS CLI 명령 참조의 AnalyzeDocument
를 참조하세요.
-
다음 코드 예시에서는 detect-document-text
의 사용 방법을 보여줍니다.
- AWS CLI
-
문서 텍스트 감지
다음
detect-document-text
예시에서는 문서에서 텍스트를 감지하는 방법을 보여줍니다.Linux/macOS:
aws textract detect-document-text \ --document '
{"S3Object":{"Bucket":"bucket","Name":"document"}}
'Windows:
aws textract detect-document-text \ --document "{\"S3Object\":{\"Bucket\":\"bucket\",\"Name\":\"document\"}}" \ --region
region-name
출력:
{ "Blocks": [ { "Geometry": { "BoundingBox": { "Width": 1.0, "Top": 0.0, "Left": 0.0, "Height": 1.0 }, "Polygon": [ { "Y": 0.0, "X": 0.0 }, { "Y": 0.0, "X": 1.0 }, { "Y": 1.0, "X": 1.0 }, { "Y": 1.0, "X": 0.0 } ] }, "Relationships": [ { "Type": "CHILD", "Ids": [ "896a9f10-9e70-4412-81ce-49ead73ed881", "0da18623-dc4c-463d-a3d1-9ac050e9e720", "167338d7-d38c-4760-91f1-79a8ec457bb2" ] } ], "BlockType": "PAGE", "Id": "21f0535e-60d5-4bc7-adf2-c05dd851fa25" }, { "Relationships": [ { "Type": "CHILD", "Ids": [ "62490c26-37ea-49fa-8034-7a9ff9369c9c", "1e4f3f21-05bd-4da9-ba10-15d01e66604c" ] } ], "Confidence": 89.11581420898438, "Geometry": { "BoundingBox": { "Width": 0.33642634749412537, "Top": 0.17169663310050964, "Left": 0.13885067403316498, "Height": 0.49159330129623413 }, "Polygon": [ { "Y": 0.17169663310050964, "X": 0.13885067403316498 }, { "Y": 0.17169663310050964, "X": 0.47527703642845154 }, { "Y": 0.6632899641990662, "X": 0.47527703642845154 }, { "Y": 0.6632899641990662, "X": 0.13885067403316498 } ] }, "Text": "He llo,", "BlockType": "LINE", "Id": "896a9f10-9e70-4412-81ce-49ead73ed881" }, { "Relationships": [ { "Type": "CHILD", "Ids": [ "19b28058-9516-4352-b929-64d7cef29daf" ] } ], "Confidence": 85.5694351196289, "Geometry": { "BoundingBox": { "Width": 0.33182239532470703, "Top": 0.23131252825260162, "Left": 0.5091826915740967, "Height": 0.3766750991344452 }, "Polygon": [ { "Y": 0.23131252825260162, "X": 0.5091826915740967 }, { "Y": 0.23131252825260162, "X": 0.8410050868988037 }, { "Y": 0.607987642288208, "X": 0.8410050868988037 }, { "Y": 0.607987642288208, "X": 0.5091826915740967 } ] }, "Text": "worlc", "BlockType": "LINE", "Id": "0da18623-dc4c-463d-a3d1-9ac050e9e720" } ], "DocumentMetadata": { "Pages": 1 } }
자세한 내용은 Amazon Textract 개발자 안내서의 Amazon Textract로 문서 텍스트 분석을 참조하세요.
-
API 세부 정보는 AWS CLI 명령 참조의 DetectDocumentText
를 참조하세요.
-
다음 코드 예시에서는 get-document-analysis
의 사용 방법을 보여줍니다.
- AWS CLI
-
여러 페이지 문서의 비동기 텍스트 분석 결과 가져오기
다음
get-document-analysis
예시에서는 여러 페이지 문서의 비동기 텍스트 분석 결과를 가져오는 방법을 보여줍니다.aws textract get-document-analysis \ --job-id
df7cf32ebbd2a5de113535fcf4d921926a701b09b4e7d089f3aebadb41e0712b
\ --max-results1000
출력:
{ "Blocks": [ { "Geometry": { "BoundingBox": { "Width": 1.0, "Top": 0.0, "Left": 0.0, "Height": 1.0 }, "Polygon": [ { "Y": 0.0, "X": 0.0 }, { "Y": 0.0, "X": 1.0 }, { "Y": 1.0, "X": 1.0 }, { "Y": 1.0, "X": 0.0 } ] }, "Relationships": [ { "Type": "CHILD", "Ids": [ "75966e64-81c2-4540-9649-d66ec341cd8f", "bb099c24-8282-464c-a179-8a9fa0a057f0", "5ebf522d-f9e4-4dc7-bfae-a288dc094595" ] } ], "BlockType": "PAGE", "Id": "247c28ee-b63d-4aeb-9af0-5f7ea8ba109e", "Page": 1 } ], "NextToken": "cY1W3eTFvoB0cH7YrKVudI4Gb0H8J0xAYLo8xI/JunCIPWCthaKQ+07n/ElyutsSy0+1VOImoTRmP1zw4P0RFtaeV9Bzhnfedpx1YqwB4xaGDA==", "DocumentMetadata": { "Pages": 1 }, "JobStatus": "SUCCEEDED" }
자세한 내용은 Amazon Textract 개발자 안내서의 여러 페이지 문서의 텍스트 감지 및 분석을 참조하세요.
-
API 세부 정보는 AWS CLI 명령 참조의 GetDocumentAnalysis
를 참조하세요.
-
다음 코드 예시에서는 get-document-text-detection
의 사용 방법을 보여줍니다.
- AWS CLI
-
여러 페이지 문서의 비동기 텍스트 감지 결과 가져오기
다음
get-document-text-detection
예시에서는 여러 페이지 문서의 비동기 텍스트 감지 결과를 가져오는 방법을 보여줍니다.aws textract get-document-text-detection \ --job-id
57849a3dc627d4df74123dca269d69f7b89329c870c65bb16c9fd63409d200b9
\ --max-results1000
출력
{ "Blocks": [ { "Geometry": { "BoundingBox": { "Width": 1.0, "Top": 0.0, "Left": 0.0, "Height": 1.0 }, "Polygon": [ { "Y": 0.0, "X": 0.0 }, { "Y": 0.0, "X": 1.0 }, { "Y": 1.0, "X": 1.0 }, { "Y": 1.0, "X": 0.0 } ] }, "Relationships": [ { "Type": "CHILD", "Ids": [ "1b926a34-0357-407b-ac8f-ec473160c6a9", "0c35dc17-3605-4c9d-af1a-d9451059df51", "dea3db8a-52c2-41c0-b50c-81f66f4aa758" ] } ], "BlockType": "PAGE", "Id": "84671a5e-8c99-43be-a9d1-6838965da33e", "Page": 1 } ], "NextToken": "GcqyoAJuZwujOT35EN4LCI3EUzMtiLq3nKyFFHvU5q1SaIdEBcSty+njNgoWwuMP/muqc96S4o5NzDqehhXvhkodMyVO5OJGyms5lsrCxibWJw==", "DocumentMetadata": { "Pages": 1 }, "JobStatus": "SUCCEEDED" }
자세한 내용은 Amazon Textract 개발자 안내서의 여러 페이지 문서의 텍스트 감지 및 분석을 참조하세요.
-
API 세부 정보는 AWS CLI 명령 참조의 GetDocumentTextDetection
을 참조하세요.
-
다음 코드 예시에서는 start-document-analysis
의 사용 방법을 보여줍니다.
- AWS CLI
-
여러 페이지 문서의 텍스트 분석 시작
다음
start-document-analysis
예시에서는 여러 페이지가 있는 문서에서 비동기식 텍스트 분석을 시작하는 방법을 보여줍니다.Linux/macOS:
aws textract start-document-analysis \ --document-location '
{"S3Object":{"Bucket":"bucket","Name":"document"}}
' \ --feature-types '["TABLES","FORMS"]
' \ --notification-channel"SNSTopicArn=arn:snsTopic,RoleArn=roleArn"
Windows:
aws textract start-document-analysis \ --document-location "{\"S3Object\":{\"Bucket\":\"bucket\",\"Name\":\"document\"}}" \ --feature-types "[\"TABLES\", \"FORMS\"]" \ --region
region-name
\ --notification-channel"SNSTopicArn=arn:snsTopic,RoleArn=roleArn"
출력:
{ "JobId": "df7cf32ebbd2a5de113535fcf4d921926a701b09b4e7d089f3aebadb41e0712b" }
자세한 내용은 Amazon Textract 개발자 안내서의 여러 페이지 문서의 텍스트 감지 및 분석을 참조하세요.
-
API 세부 정보는 AWS CLI 명령 참조의 StartDocumentAnalysis
를 참조하세요.
-
다음 코드 예시에서는 start-document-text-detection
의 사용 방법을 보여줍니다.
- AWS CLI
-
여러 페이지 문서의 텍스트 감지 시작
다음
start-document-text-detection
예시에서는 여러 페이지가 있는 문서에서 비동기식 텍스트 감지를 시작하는 방법을 보여줍니다.Linux/macOS:
aws textract start-document-text-detection \ --document-location '
{"S3Object":{"Bucket":"bucket","Name":"document"}}
' \ --notification-channel"SNSTopicArn=arn:snsTopic,RoleArn=roleARN"
Windows:
aws textract start-document-text-detection \ --document-location "{\"S3Object\":{\"Bucket\":\"bucket\",\"Name\":\"document\"}}" \ --region
region-name
\ --notification-channel"SNSTopicArn=arn:snsTopic,RoleArn=roleArn"
출력:
{ "JobId": "57849a3dc627d4df74123dca269d69f7b89329c870c65bb16c9fd63409d200b9" }
자세한 내용은 Amazon Textract 개발자 안내서의 여러 페이지 문서의 텍스트 감지 및 분석을 참조하세요.
-
API 세부 정보는 AWS CLI 명령 참조의 StartDocumentTextDetection
을 참조하세요.
-