주제 모델링을 위한 비동기 분석 - Amazon Comprehend

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

주제 모델링을 위한 비동기 분석

문서 세트의 주제를 StartTopicsDetectionJob결정하려면 를 사용하여 비동기 작업을 시작합니다. 영어 또는 스페인어로 작성된 문서의 주제를 모니터링할 수 있습니다.

시작하기 전에

시작하기 전에 다음 사항을 확인해야 합니다.

  • 입력 및 출력 버킷 - 입력 및 출력에 사용할 Amazon S3 버킷을 식별합니다. 버킷은 직접 호출하는 API와 동일한 리전에 있어야 합니다.

  • IAM 서비스 역할 - 입력 및 출력 버킷에 액세스하려면 권한이 있는 IAM 서비스 역할이 필요합니다. 자세한 내용은 비동기 작업에 필요한 역할 기반 권한을 참조하십시오.

AWS Command Line Interface 사용

다음 예제는 AWS CLI로 StartTopicsDetectionJob 작업을 사용하는 방법을 보여 줍니다.

다음은 Unix, Linux, macOS용 형식으로 지정된 예제입니다. Windows의 경우 각 줄의 끝에 있는 백슬래시(\) Unix 연속 문자를 캐럿(^)으로 바꿉니다.

aws comprehend start-topics-detection-job \ --number-of-topics topics to return \ --job-name "job name" \ --region region \ --cli-input-json file://path to JSON input file

cli-input-json 파라미터에는 다음 예시에 표시된 대로 요청 데이터가 포함된 JSON 파일의 경로를 제공해야 합니다.

{ "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role" }

주제 감지 작업 시작 요청이 성공하면 다음과 같은 응답을 받게 됩니다.

{ "JobStatus": "SUBMITTED", "JobId": "job ID" }

ListTopicsDetectionJobs작업을 사용하여 제출한 주제 검색 작업의 목록을 볼 수 있습니다. 이 목록에는 사용한 입력 및 출력 위치와 각 감지 작업의 상태에 대한 정보가 포함됩니다. 다음은 Unix, Linux, macOS용 형식으로 지정된 예제입니다. Windows의 경우 각 줄의 끝에 있는 백슬래시(\) Unix 연속 문자를 캐럿(^)으로 바꿉니다.

aws comprehend list-topics-detection-jobs \-- region

응답은 다음과 비슷한 JSON 형식으로 받게 됩니다.

{ "TopicsDetectionJobPropertiesList": [ { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "EndTime": timestamp }, { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "RUNNING", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" } } ] }

작업을 사용하여 기존 DescribeTopicsDetectionJob작업의 상태를 가져올 수 있습니다. 다음은 Unix, Linux, macOS용 형식으로 지정된 예제입니다. Windows의 경우 각 줄의 끝에 있는 백슬래시(\) Unix 연속 문자를 캐럿(^)으로 바꿉니다.

aws comprehend describe-topics-detection-job --job-id job ID

응답은 다음과 같은 JSON 형식으로 받게 됩니다.

{ "TopicsDetectionJobProperties": { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/ouput path" }, "EndTime": timestamp } }

SDK for Python 또는 AWS SDK for .NET 사용

주제 모델링 작업을 시작하는 방법에 대한 SDK 예제는 다음과 StartTopicsDetectionJob 함께 사용하십시오. AWS SDK또는 CLI를 참조하십시오.