Contoh Amazon Transcribe menggunakan AWS CLI - AWS SDKContoh Kode

Ada lebih banyak AWS SDK contoh yang tersedia di GitHub repo SDKContoh AWS Dokumen.

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Contoh Amazon Transcribe menggunakan AWS CLI

Contoh kode berikut menunjukkan cara melakukan tindakan dan mengimplementasikan skenario umum menggunakan AWS Command Line Interface with Amazon Transcribe.

Tindakan adalah kutipan kode dari program yang lebih besar dan harus dijalankan dalam konteks. Sementara tindakan menunjukkan cara memanggil fungsi layanan individual, Anda dapat melihat tindakan dalam konteks dalam skenario terkait.

Setiap contoh menyertakan tautan ke kode sumber lengkap, di mana Anda dapat menemukan instruksi tentang cara mengatur dan menjalankan kode dalam konteks.

Tindakan

Contoh kode berikut menunjukkan cara menggunakancreate-language-model.

AWS CLI

Contoh 1: Untuk membuat model bahasa khusus menggunakan data pelatihan dan penyetelan.

create-language-modelContoh berikut membuat model bahasa kustom. Anda dapat menggunakan model bahasa khusus untuk meningkatkan kinerja transkripsi untuk domain seperti hukum, perhotelan, keuangan, dan asuransi. Untuk kode bahasa, masukkan kode bahasa yang valid. Untuk base-model-name, tentukan model dasar yang paling cocok untuk laju sampel audio yang ingin Anda transkripsikan dengan model bahasa khusus Anda. Untuk model-name, tentukan nama yang ingin Anda panggil model bahasa kustom.

aws transcribe create-language-model \ --language-code language-code \ --base-model-name base-model-name \ --model-name cli-clm-example \ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-training-data",TuningDataS3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-for-tuning-data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"

Output:

{ "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }

Untuk informasi selengkapnya, lihat Meningkatkan Akurasi Transkripsi Khusus Domain dengan Model Bahasa Khusus di Panduan Pengembang Amazon Transcribe.

Contoh 2: Untuk membuat model bahasa kustom hanya menggunakan data pelatihan.

create-language-modelContoh berikut mentranskripsikan file audio Anda. Anda dapat menggunakan model bahasa khusus untuk meningkatkan kinerja transkripsi untuk domain seperti hukum, perhotelan, keuangan, dan asuransi. Untuk kode bahasa, masukkan kode bahasa yang valid. Untuk base-model-name, tentukan model dasar yang paling cocok untuk laju sampel audio yang ingin Anda transkripsikan dengan model bahasa khusus Anda. Untuk model-name, tentukan nama yang ingin Anda panggil model bahasa kustom.

aws transcribe create-language-model \ --language-code en-US \ --base-model-name base-model-name \ --model-name cli-clm-example \ --input-data-config S3Uri="s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data",DataAccessRoleArn="arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model"

Output:

{ "LanguageCode": "en-US", "BaseModelName": "base-model-name", "ModelName": "cli-clm-example", "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix-For-Training-Data/", "DataAccessRoleArn": "arn:aws:iam::your-AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" }, "ModelStatus": "IN_PROGRESS" }

Untuk informasi selengkapnya, lihat Meningkatkan Akurasi Transkripsi Khusus Domain dengan Model Bahasa Khusus di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakancreate-medical-vocabulary.

AWS CLI

Untuk membuat kosakata khusus medis

create-medical-vocabularyContoh berikut membuat kosakata kustom. Untuk membuat kosakata khusus, Anda harus membuat file teks dengan semua istilah yang ingin Anda transkripsikan dengan lebih akurat. Untuk vocabulary-file-uri, tentukan Amazon Simple Storage Service (Amazon URI S3) dari file teks tersebut. Untuk kode bahasa, tentukan kode bahasa yang sesuai dengan bahasa kosakata kustom Anda. Untuk nama kosakata, tentukan apa yang ingin Anda sebut kosakata khusus Anda.

aws transcribe create-medical-vocabulary \ --vocabulary-name cli-medical-vocab-example \ --language-code language-code \ --vocabulary-file-uri https://DOC-EXAMPLE-BUCKET.AWS-Region.amazonaws.com/the-text-file-for-the-medical-custom-vocabulary.txt

Output:

{ "VocabularyName": "cli-medical-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }

Untuk informasi selengkapnya, lihat Kosakata Kustom Medis di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakancreate-vocabulary-filter.

AWS CLI

Untuk membuat filter kosakata

create-vocabulary-filterContoh berikut membuat filter kosakata yang menggunakan file teks yang berisi daftar kata yang tidak ingin Anda tampilkan dalam transkripsi. Untuk kode bahasa, tentukan kode bahasa yang sesuai dengan bahasa filter kosakata Anda. Untuk vocabulary-filter-file-uri, tentukan Amazon Simple Storage Service (Amazon URI S3) dari file teks. Untuk vocabulary-filter-name, tentukan nama filter kosakata Anda.

aws transcribe create-vocabulary-filter \ --language-code language-code \ --vocabulary-filter-file-uri s3://DOC-EXAMPLE-BUCKET/vocabulary-filter.txt \ --vocabulary-filter-name cli-vocabulary-filter-example

Output:

{ "VocabularyFilterName": "cli-vocabulary-filter-example", "LanguageCode": "language-code" }

Untuk informasi selengkapnya, lihat Memfilter Kata yang Tidak Diinginkan di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakancreate-vocabulary.

AWS CLI

Untuk membuat kosakata khusus

create-vocabularyContoh berikut membuat kosakata kustom. Untuk membuat kosakata khusus, Anda harus membuat file teks dengan semua istilah yang ingin Anda transkripsikan dengan lebih akurat. Untuk vocabulary-file-uri, tentukan Amazon Simple Storage Service (Amazon URI S3) dari file teks tersebut. Untuk kode bahasa, tentukan kode bahasa yang sesuai dengan bahasa kosakata kustom Anda. Untuk nama kosakata, tentukan apa yang ingin Anda sebut kosakata khusus Anda.

aws transcribe create-vocabulary \ --language-code language-code \ --vocabulary-name cli-vocab-example \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/the-text-file-for-the-custom-vocabulary.txt

Output:

{ "VocabularyName": "cli-vocab-example", "LanguageCode": "language-code", "VocabularyState": "PENDING" }

Untuk informasi selengkapnya, lihat Kosakata Khusus di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakandelete-language-model.

AWS CLI

Untuk menghapus model bahasa kustom

delete-language-modelContoh berikut menghapus model bahasa kustom.

aws transcribe delete-language-model \ --model-name model-name

Perintah ini tidak menghasilkan output.

Untuk informasi selengkapnya, lihat Meningkatkan Akurasi Transkripsi Khusus Domain dengan Model Bahasa Khusus di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakandelete-medical-transcription-job.

AWS CLI

Untuk menghapus pekerjaan transkripsi medis

delete-medical-transcription-jobContoh berikut menghapus pekerjaan transkripsi medis.

aws transcribe delete-medical-transcription-job \ --medical-transcription-job-name medical-transcription-job-name

Perintah ini tidak menghasilkan output.

Untuk informasi selengkapnya, lihat DeleteMedicalTranscriptionJobdi Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakandelete-medical-vocabulary.

AWS CLI

Untuk menghapus kosakata khusus medis

delete-medical-vocabularyContoh berikut menghapus kosakata kustom medis. Untuk nama kosakata, tentukan nama kosakata khusus medis.

aws transcribe delete-vocabulary \ --vocabulary-name medical-custom-vocabulary-name

Perintah ini tidak menghasilkan output.

Untuk informasi selengkapnya, lihat Kosakata Kustom Medis di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakandelete-transcription-job.

AWS CLI

Untuk menghapus salah satu pekerjaan transkripsi Anda

delete-transcription-jobContoh berikut menghapus salah satu pekerjaan transkripsi Anda.

aws transcribe delete-transcription-job \ --transcription-job-name your-transcription-job

Perintah ini tidak menghasilkan output.

Untuk informasi selengkapnya, lihat DeleteTranscriptionJobdi Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakandelete-vocabulary-filter.

AWS CLI

Untuk menghapus filter kosakata

delete-vocabulary-filterContoh berikut menghapus filter kosakata.

aws transcribe delete-vocabulary-filter \ --vocabulary-filter-name vocabulary-filter-name

Perintah ini tidak menghasilkan output.

Untuk informasi selengkapnya, lihat Memfilter Kata yang Tidak Diinginkan di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakandelete-vocabulary.

AWS CLI

Untuk menghapus kosakata kustom

delete-vocabularyContoh berikut menghapus kosakata kustom.

aws transcribe delete-vocabulary \ --vocabulary-name vocabulary-name

Perintah ini tidak menghasilkan output.

Untuk informasi selengkapnya, lihat Kosakata Khusus di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakandescribe-language-model.

AWS CLI

Untuk mendapatkan informasi tentang model bahasa khusus tertentu

describe-language-modelContoh berikut mendapatkan informasi tentang model bahasa kustom tertentu. Misalnya, di bawah BaseModelName Anda dapat melihat apakah model Anda dilatih menggunakan WideBand model NarrowBand atau. Model bahasa khusus dengan model NarrowBand dasar dapat mentranskripsikan audio dengan laju sampel kurang dari 16kHz. Model bahasa yang menggunakan model WideBand dasar dapat mentranskripsikan audio dengan laju sampel lebih besar dari 16kHz. Parameter S3Uri menunjukkan awalan Amazon S3 yang Anda gunakan untuk mengakses data pelatihan untuk membuat model bahasa kustom.

aws transcribe describe-language-model \ --model-name cli-clm-example

Output:

{ "LanguageModel": { "ModelName": "cli-clm-example", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "base-model-name", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-with-permissions-to-create-a-custom-language-model" } } }

Untuk informasi selengkapnya, lihat Meningkatkan Akurasi Transkripsi Khusus Domain dengan Model Bahasa Khusus di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanget-medical-transcription-job.

AWS CLI

Untuk mendapatkan informasi tentang pekerjaan transkripsi medis tertentu

get-medical-transcription-jobContoh berikut mendapatkan informasi tentang pekerjaan transkripsi medis tertentu. Untuk mengakses hasil transkripsi, gunakan TranscriptFileUri parameter. Jika Anda telah mengaktifkan fitur tambahan untuk pekerjaan transkripsi, Anda dapat melihatnya di objek Pengaturan. Parameter khusus menunjukkan spesialisasi medis penyedia. Parameter Tipe menunjukkan apakah ucapan dalam pekerjaan transkripsi adalah percakapan medis, atau dikte medis.

aws transcribe get-medical-transcription-job \ --medical-transcription-job-name vocabulary-dictation-medical-transcription-job

Output:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "en-US", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://s3.Region.amazonaws.com/Amazon-S3-Prefix/vocabulary-dictation-medical-transcription-job.json" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false, "VocabularyName": "cli-medical-vocab-example" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

Untuk informasi selengkapnya, lihat Transkripsi Batch di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanget-medical-vocabulary.

AWS CLI

Untuk mendapatkan informasi tentang kosakata khusus medis

get-medical-vocabularyContoh berikut mendapatkan informasi tentang kosakata khusus medis. Anda dapat menggunakan VocabularyState parameter untuk melihat status pemrosesan kosakata. Jika yaREADY, Anda dapat menggunakannya dalam StartMedicalTranscriptionJob operasi. :

aws transcribe get-medical-vocabulary \ --vocabulary-name medical-vocab-example

Output:

{ "VocabularyName": "medical-vocab-example", "LanguageCode": "en-US", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-medical-custom-vocabulary" }

Untuk informasi selengkapnya, lihat Kosakata Kustom Medis di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanget-transcription-job.

AWS CLI

Untuk mendapatkan informasi tentang pekerjaan transkripsi tertentu

get-transcription-jobContoh berikut mendapatkan informasi tentang pekerjaan transkripsi tertentu. Untuk mengakses hasil transkripsi, gunakan TranscriptFileUri parameter. Gunakan MediaFileUri parameter untuk melihat file audio mana yang Anda transkripsikan dengan pekerjaan ini. Anda dapat menggunakan objek Pengaturan untuk melihat fitur opsional yang telah Anda aktifkan dalam pekerjaan transkripsi.

aws transcribe get-transcription-job \ --transcription-job-name your-transcription-job

Output:

{ "TranscriptionJob": { "TranscriptionJobName": "your-transcription-job", "TranscriptionJobStatus": "COMPLETED", "LanguageCode": "language-code", "MediaSampleRateHertz": 48000, "MediaFormat": "mp4", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "Transcript": { "TranscriptFileUri": "https://Amazon-S3-file-location-of-transcription-output" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "CompletionTime": "2020-09-18T22:28:21.197000+00:00", "Settings": { "ChannelIdentification": false, "ShowAlternatives": false }, "IdentifyLanguage": true, "IdentifiedLanguageScore": 0.8672199249267578 } }

Untuk informasi selengkapnya, lihat Memulai (Antarmuka Baris AWS Perintah) di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanget-vocabulary-filter.

AWS CLI

Untuk mendapatkan informasi tentang filter kosakata

get-vocabulary-filterContoh berikut mendapatkan informasi tentang filter kosakata. Anda dapat menggunakan DownloadUri parameter untuk mendapatkan daftar kata yang Anda gunakan untuk membuat filter kosakata.

aws transcribe get-vocabulary-filter \ --vocabulary-filter-name testFilter

Output:

{ "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00", "DownloadUri": "https://Amazon-S3-location-to-download-your-vocabulary-filter" }

Untuk informasi selengkapnya, lihat Memfilter Kata yang Tidak Diinginkan di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanget-vocabulary.

AWS CLI

Untuk mendapatkan informasi tentang kosakata khusus

get-vocabularyContoh berikut mendapatkan informasi tentang kosakata kustom yang dibuat sebelumnya.

aws transcribe get-vocabulary \ --vocabulary-name cli-vocab-1

Output:

{ "VocabularyName": "cli-vocab-1", "LanguageCode": "language-code", "VocabularyState": "READY", "LastModifiedTime": "2020-09-19T23:22:32.836000+00:00", "DownloadUri": "https://link-to-download-the-text-file-used-to-create-your-custom-vocabulary" }

Untuk informasi selengkapnya, lihat Kosakata Khusus di Panduan Pengembang Amazon Transcribe.

  • Untuk API detailnya, lihat GetVocabularydi Referensi AWS CLI Perintah.

Contoh kode berikut menunjukkan cara menggunakanlist-language-models.

AWS CLI

Untuk membuat daftar model bahasa kustom

list-language-modelsContoh berikut mencantumkan model bahasa kustom yang terkait dengan AWS akun dan Wilayah Anda. Anda dapat menggunakan TuningDataS3Uri parameter S3Uri dan untuk menemukan awalan Amazon S3 yang telah Anda gunakan sebagai data pelatihan, atau data penyetelan Anda. Ini BaseModelName memberi tahu Anda apakah Anda telah menggunakan NarrowBand, atau WideBand model untuk membuat model bahasa khusus. Anda dapat mentranskripsikan audio dengan laju sampel kurang dari 16 kHz dengan model bahasa khusus menggunakan model NarrowBand dasar. Anda dapat mentranskripsikan audio 16 kHz atau lebih besar dengan model bahasa khusus menggunakan model WideBand dasar. ModelStatusParameter menunjukkan apakah Anda dapat menggunakan model bahasa khusus dalam pekerjaan transkripsi. Jika nilainyaCOMPLETED, Anda dapat menggunakannya dalam pekerjaan transkripsi.

aws transcribe list-language-models

Output:

{ "Models": [ { "ModelName": "cli-clm-2", "CreateTime": "2020-09-25T17:57:38.504000+00:00", "LastModifiedTime": "2020-09-25T17:57:48.585000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "TuningDataS3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-tuning-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "cli-clm-1", "CreateTime": "2020-09-25T17:16:01.835000+00:00", "LastModifiedTime": "2020-09-25T17:16:15.555000+00:00", "LanguageCode": "language-code", "BaseModelName": "WideBand", "ModelStatus": "IN_PROGRESS", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } }, { "ModelName": "clm-console-1", "CreateTime": "2020-09-24T19:26:28.076000+00:00", "LastModifiedTime": "2020-09-25T04:25:22.271000+00:00", "LanguageCode": "language-code", "BaseModelName": "NarrowBand", "ModelStatus": "COMPLETED", "UpgradeAvailability": false, "InputDataConfig": { "S3Uri": "s3://DOC-EXAMPLE-BUCKET/clm-training-data/", "DataAccessRoleArn": "arn:aws:iam::AWS-account-number:role/IAM-role-used-to-create-the-custom-language-model" } } ] }

Untuk informasi selengkapnya, lihat Meningkatkan Akurasi Transkripsi Khusus Domain dengan Model Bahasa Khusus di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanlist-medical-transcription-jobs.

AWS CLI

Untuk membuat daftar pekerjaan transkripsi medis Anda

list-medical-transcription-jobsContoh berikut mencantumkan pekerjaan transkripsi medis yang terkait dengan AWS akun dan Wilayah Anda. Untuk mendapatkan informasi lebih lanjut tentang pekerjaan transkripsi tertentu, salin nilai MedicalTranscriptionJobName parameter dalam output transkripsi, dan tentukan nilai itu untuk MedicalTranscriptionJobName opsi perintah. get-medical-transcription-job Untuk melihat lebih banyak pekerjaan transkripsi Anda, salin nilai NextToken parameter, jalankan list-medical-transcription-jobs perintah lagi, dan tentukan nilai itu di --next-token opsi.

aws transcribe list-medical-transcription-jobs

Output:

{ "NextToken": "3/PblzkiGhzjER3KHuQt2fmbPLF7cDYafjFMEoGn44ON/gsuUSTIkGyanvRE6WMXFd/ZTEc2EZj+P9eii/z1O2FDYli6RLI0WoRX4RwMisVrh9G0Kie0Y8ikBCdtqlZB10Wa9McC+ebOl+LaDtZPC4u6ttoHLRlEfzqstHXSgapXg3tEBtm9piIaPB6MOM5BB6t86+qtmocTR/qrteHZBBudhTfbCwhsxaqujHiiUvFdm3BQbKKWIW06yV9b+4f38oD2lVIan+vfUs3gBYAl5VTDmXXzQPBQOHPjtwmFI+IWX15nSUjWuN3TUylHgPWzDaYT8qBtu0Z+3UG4V6b+K2CC0XszXg5rBq9hYgNzy4XoFh/6s5DoSnzq49Q9xHgHdT2yBADFmvFK7myZBsj75+2vQZOSVpWUPy3WT/32zFAcoELHR4unuWhXPwjbKU+mFYfUjtTZ8n/jq7aQEjQ42A+X/7K6JgOcdVPtEg8PlDr5kgYYG3q3OmYXX37U3FZuJmnTI63VtIXsNnOU5eGoYObtpk00Nq9UkzgSJxqj84ZD5n+S0EGy9ZUYBJRRcGeYUM3Q4DbSJfUwSAqcFdLIWZdp8qIREMQIBWy7BLwSdyqsQo2vRrd53hm5aWM7SVf6pPq6X/IXR5+1eUOOD8/coaTT4ES2DerbV6RkV4o0VT1d0SdVX/MmtkNG8nYj8PqU07w7988quh1ZP6D80veJS1q73tUUR9MjnGernW2tAnvnLNhdefBcD+sZVfYq3iBMFY7wTy1P1G6NqW9GrYDYoX3tTPWlD7phpbVSyKrh/PdYrps5UxnsGoA1b7L/FfAXDfUoGrGUB4N3JsPYXX9D++g+6gV1qBBs/WfF934aKqfD6UTggm/zV3GAOWiBpfvAZRvEb924i6yGHyMC7y54O1ZAwSBupmI+FFd13CaPO4kN1vJlth6aM5vUPXg4BpyUhtbRhwD/KxCvf9K0tLJGyL1A==", "MedicalTranscriptionJobSummaries": [ { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "StartTime": "2020-09-21T21:17:27.045000+00:00", "CompletionTime": "2020-09-21T21:17:59.561000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "StartTime": "2020-09-21T21:01:14.592000+00:00", "CompletionTime": "2020-09-21T21:01:43.606000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }, { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "StartTime": "2020-09-21T19:09:18.199000+00:00", "CompletionTime": "2020-09-21T19:10:22.516000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "StartTime": "2020-09-21T18:43:37.265000+00:00", "CompletionTime": "2020-09-21T18:44:21.192000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" }, { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "StartTime": "2020-09-20T23:46:44.081000+00:00", "CompletionTime": "2020-09-20T23:47:35.851000+00:00", "LanguageCode": "en-US", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "CUSTOMER_BUCKET", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } ] }

Untuk informasi selengkapnya, lihat https://docs.aws.amazon.com/transcribe/ latest/dg/batch -med-transcription.html> di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanlist-medical-vocabularies.

AWS CLI

Untuk membuat daftar kosakata khusus medis Anda

list-medical-vocabulariesContoh berikut mencantumkan kosakata khusus medis yang terkait dengan AWS akun dan Wilayah Anda. Untuk mendapatkan informasi lebih lanjut tentang pekerjaan transkripsi tertentu, salin nilai MedicalTranscriptionJobName parameter dalam output transkripsi, dan tentukan nilai itu untuk MedicalTranscriptionJobName opsi perintah. get-medical-transcription-job Untuk melihat lebih banyak pekerjaan transkripsi Anda, salin nilai NextToken parameter, jalankan list-medical-transcription-jobs perintah lagi, dan tentukan nilai itu di --next-token opsi.

aws transcribe list-medical-vocabularies

Output:

{ "Vocabularies": [ { "VocabularyName": "cli-medical-vocab-2", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-21T21:44:59.521000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "cli-medical-vocab-1", "LanguageCode": "en-US", "LastModifiedTime": "2020-09-19T23:59:04.349000+00:00", "VocabularyState": "READY" } ] }

Untuk informasi selengkapnya, lihat Kosakata Kustom Medis di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanlist-transcription-jobs.

AWS CLI

Untuk membuat daftar pekerjaan transkripsi Anda

list-transcription-jobsContoh berikut mencantumkan pekerjaan transkripsi yang terkait dengan AWS akun dan Wilayah Anda.

aws transcribe list-transcription-jobs

Output:

{ "NextToken": "NextToken", "TranscriptionJobSummaries": [ { "TranscriptionJobName": "speak-id-job-1", "CreationTime": "2020-08-17T21:06:15.391000+00:00", "StartTime": "2020-08-17T21:06:15.416000+00:00", "CompletionTime": "2020-08-17T21:07:05.098000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "job-1", "CreationTime": "2020-08-17T20:50:24.207000+00:00", "StartTime": "2020-08-17T20:50:24.230000+00:00", "CompletionTime": "2020-08-17T20:52:18.737000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "sdk-test-job-4", "CreationTime": "2020-08-17T20:32:27.917000+00:00", "StartTime": "2020-08-17T20:32:27.956000+00:00", "CompletionTime": "2020-08-17T20:33:15.126000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "Diarization-speak-id", "CreationTime": "2020-08-10T22:10:09.066000+00:00", "StartTime": "2020-08-10T22:10:09.116000+00:00", "CompletionTime": "2020-08-10T22:26:48.172000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" }, { "TranscriptionJobName": "your-transcription-job-name", "CreationTime": "2020-07-29T17:45:09.791000+00:00", "StartTime": "2020-07-29T17:45:09.826000+00:00", "CompletionTime": "2020-07-29T17:46:20.831000+00:00", "LanguageCode": "language-code", "TranscriptionJobStatus": "COMPLETED", "OutputLocationType": "SERVICE_BUCKET" } ] }

Untuk informasi selengkapnya, lihat Memulai (Antarmuka Baris AWS Perintah) di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanlist-vocabularies.

AWS CLI

Untuk membuat daftar kosakata kustom Anda

list-vocabulariesContoh berikut mencantumkan kosakata kustom yang terkait dengan AWS akun dan Wilayah Anda.

aws transcribe list-vocabularies

Output:

{ "NextToken": "NextToken", "Vocabularies": [ { "VocabularyName": "ards-test-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-27T22:00:27.330000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "sample-test", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T23:04:11.044000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-3-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T22:12:22.277000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-test-2", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:53:50.455000+00:00", "VocabularyState": "READY" }, { "VocabularyName": "CRLF-to-LF-1-1", "LanguageCode": "language-code", "LastModifiedTime": "2020-04-24T21:39:33.356000+00:00", "VocabularyState": "READY" } ] }

Untuk informasi selengkapnya, lihat Kosakata Khusus di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanlist-vocabulary-filters.

AWS CLI

Untuk membuat daftar filter kosakata Anda

list-vocabulary-filtersContoh berikut mencantumkan filter kosakata yang terkait dengan AWS akun dan Wilayah Anda.

aws transcribe list-vocabulary-filters

Output:

{ "NextToken": "NextToken": [ { "VocabularyFilterName": "testFilter", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-07T22:39:32.147000+00:00" }, { "VocabularyFilterName": "testFilter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-21T23:29:35.174000+00:00" }, { "VocabularyFilterName": "filter2", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-08T20:18:26.426000+00:00" }, { "VocabularyFilterName": "filter-review", "LanguageCode": "language-code", "LastModifiedTime": "2020-06-03T18:52:30.448000+00:00" }, { "VocabularyFilterName": "crlf-filt", "LanguageCode": "language-code", "LastModifiedTime": "2020-05-22T19:42:42.737000+00:00" } ] }

Untuk informasi selengkapnya, lihat Memfilter Kata yang Tidak Diinginkan di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanstart-medical-transcription-job.

AWS CLI

Contoh 1: Untuk mentranskripsikan dikte medis yang disimpan sebagai file audio

start-medical-transcription-jobContoh berikut mentranskripsikan file audio. Anda menentukan lokasi output transkripsi dalam OutputBucketName parameter.

aws transcribe start-medical-transcription-job \ --cli-input-json file://myfile.json

Isi dari myfile.json:

{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }

Output:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T00:35:22.256000+00:00", "CreationTime": "2020-09-20T00:35:22.218000+00:00", "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

Untuk informasi selengkapnya, lihat Ikhtisar Transkripsi Batch di Panduan Pengembang Amazon Transcribe.

Contoh 2: Untuk mentranskripsikan dialog klinis-pasien yang disimpan sebagai file audio

start-medical-transcription-jobContoh berikut mentranskripsikan file audio yang berisi dialog klinis-pasien. Anda menentukan lokasi output transkripsi dalam OutputBucketName parameter.

aws transcribe start-medical-transcription-job \ --cli-input-json file://mysecondfile.json

Isi dari mysecondfile.json:

{ "MedicalTranscriptionJobName": "simple-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" } }

Output:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "simple-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:19:49.965000+00:00", "CreationTime": "2020-09-20T23:19:49.941000+00:00", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

Untuk informasi selengkapnya, lihat Ikhtisar Transkripsi Batch di Panduan Pengembang Amazon Transcribe.

Contoh 3: Untuk mentranskripsikan file audio multisaluran dari dialog dokter-pasien

start-medical-transcription-jobContoh berikut mentranskripsikan audio dari setiap saluran dalam file audio dan menggabungkan transkripsi terpisah dari setiap saluran menjadi satu output transkripsi. Anda menentukan lokasi output transkripsi dalam OutputBucketName parameter.

aws transcribe start-medical-transcription-job \ --cli-input-json file://mythirdfile.json

Isi dari mythirdfile.json:

{ "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ChannelIdentification": true } }

Output:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "multichannel-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-20T23:46:44.081000+00:00", "CreationTime": "2020-09-20T23:46:44.053000+00:00", "Settings": { "ChannelIdentification": true }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

Untuk informasi selengkapnya, lihat Identifikasi Saluran di Panduan Pengembang Amazon Transcribe.

Contoh 4: Untuk mentranskripsikan file audio dari dialog klinis-pasien dan mengidentifikasi pembicara dalam output transkripsi

start-medical-transcription-jobContoh berikut mentranskripsikan file audio dan memberi label ucapan setiap pembicara dalam output transkripsi. Anda menentukan lokasi output transkripsi dalam OutputBucketName parameter.

aws transcribe start-medical-transcription-job \ --cli-input-json file://myfourthfile.json

Isi dari myfourthfile.json:

{ "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }

Output:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "speaker-id-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T18:43:37.265000+00:00", "CreationTime": "2020-09-21T18:43:37.157000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

Untuk informasi selengkapnya, lihat Mengidentifikasi Pembicara di Panduan Pengembang Amazon Transcribe.

Contoh 5: Untuk mentranskripsikan percakapan medis yang disimpan sebagai file audio dengan hingga dua alternatif transkripsi

start-medical-transcription-jobContoh berikut membuat hingga dua transkripsi alternatif dari satu file audio. Setiap transkripsi memiliki tingkat kepercayaan yang terkait dengannya. Secara default, Amazon Transcribe mengembalikan transkripsi dengan tingkat kepercayaan tertinggi. Anda dapat menentukan bahwa Amazon Transcribe mengembalikan transkripsi tambahan dengan tingkat kepercayaan yang lebih rendah. Anda menentukan lokasi output transkripsi dalam OutputBucketName parameter.

aws transcribe start-medical-transcription-job \ --cli-input-json file://myfifthfile.json

Isi dari myfifthfile.json:

{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }

Output:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T19:09:18.199000+00:00", "CreationTime": "2020-09-21T19:09:18.171000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "CONVERSATION" } }

Untuk informasi selengkapnya, lihat Transkripsi Alternatif di Panduan Pengembang Amazon Transcribe.

Contoh 6: Untuk mentranskripsikan file audio dikte medis dengan hingga dua transkripsi alternatif

start-medical-transcription-jobContoh berikut mentranskripsikan file audio dan menggunakan filter kosakata untuk menutupi kata-kata yang tidak diinginkan. Anda menentukan lokasi output transkripsi dalam OutputBucketName parameter.

aws transcribe start-medical-transcription-job \ --cli-input-json file://mysixthfile.json

Isi dari mysixthfile.json:

{ "MedicalTranscriptionJobName": "alternatives-conversation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }

Output:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "alternatives-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:01:14.592000+00:00", "CreationTime": "2020-09-21T21:01:14.569000+00:00", "Settings": { "ShowAlternatives": true, "MaxAlternatives": 2 }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

Untuk informasi selengkapnya, lihat Transkripsi Alternatif di Panduan Pengembang Amazon Transcribe.

Contoh 7: Untuk mentranskripsikan file audio dikte medis dengan akurasi yang meningkat dengan menggunakan kosakata khusus

start-medical-transcription-jobContoh berikut mentranskripsikan file audio dan menggunakan kosakata khusus medis yang telah Anda buat sebelumnya untuk meningkatkan akurasi transkripsi. Anda menentukan lokasi output transkripsi dalam OutputBucketName parameter.

aws transcribe start-transcription-job \ --cli-input-json file://myseventhfile.json

Isi dari mysixthfile.json:

{ "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "LanguageCode": "language-code", "Specialty": "PRIMARYCARE", "Type": "DICTATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "Settings":{ "VocabularyName": "cli-medical-vocab-1" } }

Output:

{ "MedicalTranscriptionJob": { "MedicalTranscriptionJobName": "vocabulary-dictation-medical-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.extension" }, "StartTime": "2020-09-21T21:17:27.045000+00:00", "CreationTime": "2020-09-21T21:17:27.016000+00:00", "Settings": { "VocabularyName": "cli-medical-vocab-1" }, "Specialty": "PRIMARYCARE", "Type": "DICTATION" } }

Untuk informasi selengkapnya, lihat Kosakata Kustom Medis di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanstart-transcription-job.

AWS CLI

Contoh 1: Untuk mentranskripsikan file audio

start-transcription-jobContoh berikut mentranskripsikan file audio Anda.

aws transcribe start-transcription-job \ --cli-input-json file://myfile.json

Isi dari myfile.json:

{ "TranscriptionJobName": "cli-simple-transcription-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }

Untuk informasi selengkapnya, lihat Memulai (Antarmuka Baris AWS Perintah) di Panduan Pengembang Amazon Transcribe.

Contoh 2: Untuk mentranskripsikan file audio multi-saluran

start-transcription-jobContoh berikut mentranskripsikan file audio multi-saluran Anda.

aws transcribe start-transcription-job \ --cli-input-json file://mysecondfile.json

Isi dari mysecondfile.json:

{ "TranscriptionJobName": "cli-channelid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ChannelIdentification":true } }

Output:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-channelid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:07:56.817000+00:00", "CreationTime": "2020-09-17T16:07:56.784000+00:00", "Settings": { "ChannelIdentification": true } } }

Untuk informasi selengkapnya, lihat Mentranskripsikan Audio Multi-Saluran di Panduan Pengembang Amazon Transcribe.

Contoh 3: Untuk mentranskripsikan file audio dan mengidentifikasi speaker yang berbeda

start-transcription-jobContoh berikut mentranskripsikan file audio Anda dan mengidentifikasi speaker dalam output transkripsi.

aws transcribe start-transcription-job \ --cli-input-json file://mythirdfile.json

Isi dari mythirdfile.json:

{ "TranscriptionJobName": "cli-speakerid-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } }

Output:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-speakerid-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-17T16:22:59.696000+00:00", "CreationTime": "2020-09-17T16:22:59.676000+00:00", "Settings": { "ShowSpeakerLabels": true, "MaxSpeakerLabels": 2 } } }

Untuk informasi selengkapnya, lihat Mengidentifikasi Pembicara di Panduan Pengembang Amazon Transcribe.

Contoh 4: Untuk mentranskripsikan file audio dan menutupi kata-kata yang tidak diinginkan dalam output transkripsi

start-transcription-jobContoh berikut mentranskripsikan file audio Anda dan menggunakan filter kosakata yang sebelumnya Anda buat untuk menutupi kata-kata yang tidak diinginkan.

aws transcribe start-transcription-job \ --cli-input-json file://myfourthfile.json

Isi dari myfourthfile.json:

{ "TranscriptionJobName": "cli-filter-mask-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } }

Output:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-mask-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "mask" } } }

Untuk informasi selengkapnya, lihat Memfilter Transkripsi di Panduan Pengembang Amazon Transcribe.

Contoh 5: Untuk mentranskripsikan file audio dan menghapus kata-kata yang tidak diinginkan dalam output transkripsi

start-transcription-jobContoh berikut mentranskripsikan file audio Anda dan menggunakan filter kosakata yang sebelumnya Anda buat untuk menutupi kata-kata yang tidak diinginkan.

aws transcribe start-transcription-job \ --cli-input-json file://myfifthfile.json

Isi dari myfifthfile.json:

{ "TranscriptionJobName": "cli-filter-remove-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } }

Output:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-filter-remove-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyFilterName": "your-vocabulary-filter", "VocabularyFilterMethod": "remove" } } }

Untuk informasi selengkapnya, lihat Memfilter Transkripsi di Panduan Pengembang Amazon Transcribe.

Contoh 6: Untuk mentranskripsikan file audio dengan akurasi yang meningkat menggunakan kosakata khusus

start-transcription-jobContoh berikut mentranskripsikan file audio Anda dan menggunakan filter kosakata yang sebelumnya Anda buat untuk menutupi kata-kata yang tidak diinginkan.

aws transcribe start-transcription-job \ --cli-input-json file://mysixthfile.json

Isi dari mysixthfile.json:

{ "TranscriptionJobName": "cli-vocab-job", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "Settings":{ "VocabularyName": "your-vocabulary" } }

Output:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-vocab-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "the-language-of-your-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T16:36:18.568000+00:00", "CreationTime": "2020-09-18T16:36:18.547000+00:00", "Settings": { "VocabularyName": "your-vocabulary" } } }

Untuk informasi selengkapnya, lihat Memfilter Transkripsi di Panduan Pengembang Amazon Transcribe.

Contoh 7: Untuk mengidentifikasi bahasa file audio dan menuliskannya

start-transcription-jobContoh berikut mentranskripsikan file audio Anda dan menggunakan filter kosakata yang sebelumnya Anda buat untuk menutupi kata-kata yang tidak diinginkan.

aws transcribe start-transcription-job \ --cli-input-json file://myseventhfile.json

Isi dari myseventhfile.json:

{ "TranscriptionJobName": "cli-identify-language-transcription-job", "IdentifyLanguage": true, "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" } }

Output:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-identify-language-transcription-job", "TranscriptionJobStatus": "IN_PROGRESS", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/Amazon-S3-prefix/your-media-file-name.file-extension" }, "StartTime": "2020-09-18T22:27:23.970000+00:00", "CreationTime": "2020-09-18T22:27:23.948000+00:00", "IdentifyLanguage": true } }

Untuk informasi selengkapnya, lihat Mengidentifikasi Bahasa di Panduan Pengembang Amazon Transcribe.

Contoh 8: Untuk mentranskripsikan file audio dengan informasi yang dapat diidentifikasi secara pribadi disunting

start-transcription-jobContoh berikut mentranskripsikan file audio Anda dan menyunting informasi identitas pribadi apa pun dalam keluaran transkripsi.

aws transcribe start-transcription-job \ --cli-input-json file://myeighthfile.json

Isi dari myeigthfile.json:

{ "TranscriptionJobName": "cli-redaction-job", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted", "RedactionType":"PII" } }

Output:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:49:13.195000+00:00", "CreationTime": "2020-09-25T23:49:13.176000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted" } } }

Untuk informasi selengkapnya, lihat Redaksi Konten Otomatis di Panduan Pengembang Amazon Transcribe.

Contoh 9: Untuk menghasilkan transkrip dengan informasi yang dapat diidentifikasi secara pribadi (PII) disunting dan transkrip yang tidak disunting

start-transcription-jobContoh berikut menghasilkan dua transkripsi file audio Anda, satu dengan informasi yang dapat diidentifikasi secara pribadi disunting, dan yang lainnya tanpa redaksi apa pun.

aws transcribe start-transcription-job \ --cli-input-json file://myninthfile.json

Isi dari myninthfile.json:

{ "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "ContentRedaction": { "RedactionOutput":"redacted_and_unredacted", "RedactionType":"PII" } }

Output:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-redaction-job-with-unredacted-transcript", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://Amazon-S3-Prefix/your-media-file.file-extension" }, "StartTime": "2020-09-25T23:59:47.677000+00:00", "CreationTime": "2020-09-25T23:59:47.653000+00:00", "ContentRedaction": { "RedactionType": "PII", "RedactionOutput": "redacted_and_unredacted" } } }

Untuk informasi selengkapnya, lihat Redaksi Konten Otomatis di Panduan Pengembang Amazon Transcribe.

Contoh 10: Untuk menggunakan model bahasa kustom yang sebelumnya Anda buat untuk mentranskripsikan file audio.

start-transcription-jobContoh berikut mentranskripsikan file audio Anda dengan model bahasa khusus yang telah Anda buat sebelumnya.

aws transcribe start-transcription-job \ --cli-input-json file://mytenthfile.json

Isi dari mytenthfile.json:

{ "TranscriptionJobName": "cli-clm-2-job-1", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "ModelSettings": { "LanguageModelName":"cli-clm-2" } }

Output:

{ "TranscriptionJob": { "TranscriptionJobName": "cli-clm-2-job-1", "TranscriptionJobStatus": "IN_PROGRESS", "LanguageCode": "language-code", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/your-audio-file.file-extension" }, "StartTime": "2020-09-28T17:56:01.835000+00:00", "CreationTime": "2020-09-28T17:56:01.801000+00:00", "ModelSettings": { "LanguageModelName": "cli-clm-2" } } }

Untuk informasi selengkapnya, lihat Meningkatkan Akurasi Transkripsi Khusus Domain dengan Model Bahasa Khusus di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanupdate-medical-vocabulary.

AWS CLI

Untuk memperbarui kosakata khusus medis dengan istilah baru.

update-medical-vocabularyContoh berikut menggantikan istilah yang digunakan dalam kosakata khusus medis dengan yang baru. Prasyarat: untuk mengganti istilah dalam kosakata khusus medis, Anda memerlukan file dengan istilah baru.

aws transcribe update-medical-vocabulary \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/medical-custom-vocabulary.txt \ --vocabulary-name medical-custom-vocabulary \ --language-code language

Output:

{ "VocabularyName": "medical-custom-vocabulary", "LanguageCode": "en-US", "VocabularyState": "PENDING" }

Untuk informasi selengkapnya, lihat Kosakata Kustom Medis di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanupdate-vocabulary-filter.

AWS CLI

Untuk mengganti kata-kata dalam filter kosakata

update-vocabulary-filterContoh berikut menggantikan kata-kata dalam filter kosakata dengan yang baru. Prasyarat: Untuk memperbarui filter kosakata dengan kata-kata baru, Anda harus menyimpan kata-kata itu sebagai file teks.

aws transcribe update-vocabulary-filter \ --vocabulary-filter-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/your-text-file-to-update-your-vocabulary-filter.txt \ --vocabulary-filter-name vocabulary-filter-name

Output:

{ "VocabularyFilterName": "vocabulary-filter-name", "LanguageCode": "language-code", "LastModifiedTime": "2020-09-23T18:40:35.139000+00:00" }

Untuk informasi selengkapnya, lihat Memfilter Kata yang Tidak Diinginkan di Panduan Pengembang Amazon Transcribe.

Contoh kode berikut menunjukkan cara menggunakanupdate-vocabulary.

AWS CLI

Untuk memperbarui kosakata khusus dengan istilah baru.

update-vocabularyContoh berikut menimpa istilah yang digunakan untuk membuat kosakata khusus dengan yang baru yang Anda berikan. Prasyarat: untuk mengganti istilah dalam kosakata khusus, Anda memerlukan file dengan istilah baru.

aws transcribe update-vocabulary \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/Amazon-S3-Prefix/custom-vocabulary.txt \ --vocabulary-name custom-vocabulary \ --language-code language-code

Output:

{ "VocabularyName": "custom-vocabulary", "LanguageCode": "language", "VocabularyState": "PENDING" }

Untuk informasi selengkapnya, lihat Kosakata Khusus di Panduan Pengembang Amazon Transcribe.