사용자 지정 분류에 대한 실시간 분석(API) - Amazon Comprehend

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

사용자 지정 분류에 대한 실시간 분석(API)

Amazon Comprehend를 사용하여 사용자 지정 모델을 사용하여 실시간 분류를 API 실행할 수 있습니다. 먼저, 실시간 분석을 실행할 엔드포인트를 생성합니다. 엔드포인트를 생성한 후 실시간 분류를 실행합니다.

이 섹션의 예제에서는 Unix, Linux 및 macOS용 명령 형식을 사용합니다. Windows의 경우 각 줄의 끝에 있는 백슬래시(\) Unix 연속 문자를 캐럿(^)으로 바꿉니다.

프로비저닝 엔드포인트 처리량 및 관련 비용에 대한 자세한 내용은 Amazon Comprehend 엔드포인트 사용을 참조하세요.

사용자 지정 분류를 위한 엔드포인트 생성

다음 예제에서는를 사용하는 CreateEndpoint API 작업을 보여줍니다 AWS CLI.

aws comprehend create-endpoint \ --desired-inference-units number of inference units \ --endpoint-name endpoint name \ --model-arn arn:aws:comprehend:region:account-id:model/example \ --tags Key=My1stTag,Value=Value1

Amazon Comprehend가 다음과 같이 응답합니다.

{ "EndpointArn": "Arn" }

실시간 사용자 지정 분류 실행

사용자 지정 분류 모델에 대한 엔드포인트를 생성한 후 엔드포인트를 사용하여 ClassifyDocument API 작업을 실행합니다. text 또는 bytes 파라미터를 사용하여 텍스트 입력을 제공할 수 있습니다. bytes 파라미터를 사용하여 다른 입력 유형을 입력합니다.

이미지 파일 및 PDF 파일의 경우 DocumentReaderConfig 파라미터를 사용하여 기본 텍스트 추출 작업을 재정의할 수 있습니다. 자세한 내용은 텍스트 추출 옵션을 참조하세요.

최상의 결과를 얻으려면 입력 유형을 분류기 모델 유형과 일치시키십시오. 일반 텍스트 모델에 기본 문서를 제출하거나 기본 문서 모델에 일반 텍스트 파일을 제출하는 경우 API 응답에 경고가 포함됩니다. 자세한 내용은 학습 분류 모델 단원을 참조하십시오.

사용 AWS Command Line Interface

다음 예제에서는 classify-document CLI 명령을 사용하는 방법을 보여줍니다.

를 사용하여 텍스트 분류 AWS CLI

다음 예제에서는 텍스트 블록에 대해 실시간 분류를 실행합니다.

aws comprehend classify-document \ --endpoint-arn arn:aws:comprehend:region:account-id:endpoint/endpoint name \ --text 'From the Tuesday, April 16th, 1912 edition of The Guardian newspaper: The maiden voyage of the White Star liner Titanic, the largest ship ever launched ended in disaster. The Titanic started her trip from Southampton for New York on Wednesday. Late on Sunday night she struck an iceberg off the Grand Banks of Newfoundland. By wireless telegraphy she sent out signals of distress, and several liners were near enough to catch and respond to the call.'

Amazon Comprehend가 다음과 같이 응답합니다.

{ "Classes": [ { "Name": "string", "Score": 0.9793661236763 } ] }

를 사용하여 반정형 문서 분류 AWS CLI

PDF, Word 또는 이미지 파일의 사용자 지정 분류를 분석하려면 bytes 파라미터의 입력 파일로 classify-document 명령을 실행합니다.

다음 예제에서는 이미지를 입력 파일로 사용합니다. fileb 옵션을 사용하여 이미지 파일 바이트를 base-64로 인코딩합니다. 자세한 내용은 AWS Command Line Interface 사용 설명서의 바이너리 대형 객체를 참조하세요.

이 예제는 라는 JSON 파일을 전달config.json하여 텍스트 추출 옵션을 설정합니다.

$ aws comprehend classify-document \ > --endpoint-arn arn \ > --language-code en \ > --bytes fileb://image1.jpg \ > --document-reader-config file://config.json

config.json 파일에는 다음 내용이 포함되어 있습니다.

{ "DocumentReadMode": "FORCE_DOCUMENT_READ_ACTION", "DocumentReadAction": "TEXTRACT_DETECT_DOCUMENT_TEXT" }

Amazon Comprehend가 다음과 같이 응답합니다.

{ "Classes": [ { "Name": "string", "Score": 0.9793661236763 } ] }

자세한 내용은 Amazon Comprehend API 참조ClassifyDocument의 섹션을 참조하세요.