Analisis asinkron untuk pemodelan topik - Amazon Comprehend

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Analisis asinkron untuk pemodelan topik

Untuk menentukan topik dalam kumpulan dokumen, gunakan StartTopicsDetectionJobuntuk memulai pekerjaan asinkron. Anda dapat memantau topik dalam dokumen yang ditulis dalam bahasa Inggris atau Spanyol.

Sebelum Anda mulai

Sebelum Anda mulai, pastikan Anda memiliki:

  • Bucket input dan output —Identifikasi bucket Amazon S3 yang ingin Anda gunakan untuk input dan output. Bucket harus berada di Wilayah yang sama dengan API yang Anda panggil.

  • Peran layanan IAM —Anda harus memiliki peran layanan IAM dengan izin untuk mengakses bucket input dan output Anda. Untuk informasi selengkapnya, lihat Izin berbasis peran yang diperlukan untuk operasi asinkron.

Menggunakan AWS Command Line Interface

Contoh berikut menunjukkan menggunakan StartTopicsDetectionJob operasi dengan AWS CLI

Contoh diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\) Unix di akhir setiap baris dengan tanda sisipan (^).

aws comprehend start-topics-detection-job \ --number-of-topics topics to return \ --job-name "job name" \ --region region \ --cli-input-json file://path to JSON input file

Untuk cli-input-json parameter Anda menyediakan path ke file JSON yang berisi data permintaan, seperti yang ditunjukkan pada contoh berikut.

{ "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_FILE" }, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "DataAccessRoleArn": "arn:aws:iam::account ID:role/data access role" }

Jika permintaan untuk memulai pekerjaan deteksi topik berhasil, Anda akan menerima tanggapan berikut:

{ "JobStatus": "SUBMITTED", "JobId": "job ID" }

Gunakan ListTopicsDetectionJobsoperasi untuk melihat daftar pekerjaan deteksi topik yang telah Anda kirimkan. Daftar ini mencakup informasi tentang lokasi input dan output yang Anda gunakan dan status setiap pekerjaan deteksi. Contoh diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\) Unix di akhir setiap baris dengan tanda sisipan (^).

aws comprehend list-topics-detection-jobs \-- region

Anda akan mendapatkan JSON yang mirip dengan yang berikut sebagai tanggapan:

{ "TopicsDetectionJobPropertiesList": [ { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" }, "EndTime": timestamp }, { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "RUNNING", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/output path" } } ] }

Anda dapat menggunakan DescribeTopicsDetectionJoboperasi untuk mendapatkan status pekerjaan yang ada. Contoh diformat untuk Unix, Linux, dan macOS. Untuk Windows, ganti karakter kelanjutan backslash (\) Unix di akhir setiap baris dengan tanda sisipan (^).

aws comprehend describe-topics-detection-job --job-id job ID

Anda akan mendapatkan JSON berikut sebagai tanggapan:

{ "TopicsDetectionJobProperties": { "InputDataConfig": { "S3Uri": "s3://input bucket/input path", "InputFormat": "ONE_DOC_PER_LINE" }, "NumberOfTopics": topics to return, "JobId": "job ID", "JobStatus": "COMPLETED", "JobName": "job name", "SubmitTime": timestamp, "OutputDataConfig": { "S3Uri": "s3://output bucket/ouput path" }, "EndTime": timestamp } }

Menggunakan SDK untuk Python atau AWS SDK for .NET

Untuk contoh SDK tentang cara memulai pekerjaan pemodelan topik, lihatGunakan StartTopicsDetectionJob dengan AWS SDK atau CLI.