Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan file teks untuk membuat kosakata khusus medis
Untuk membuat kosakata kustom, Anda harus telah menyiapkan file teks yang berisi koleksi kata atau frasa. Amazon Transcribe Medis menggunakan file teks ini untuk membuat kosakata khusus yang dapat Anda gunakan untuk meningkatkan akurasi transkripsi kata atau frasa tersebut. Anda dapat membuat kosakata khusus menggunakan CreateMedicalVocabulary
API atau konsolAmazon Transcribe Medis.
Untuk menggunakanAWS Management Console untuk membuat kosakata kustom, Anda menyediakanAmazon S3 URI dari file teks yang berisi kata-kata atau frasa Anda.
-
Masuk ke AWS Management Console
. -
Dalam panel navigasi, di bawahAmazon Transcribe Medis, pilih Kosakata khusus.
-
Untuk Nama, di bawah pengaturan Kosakata, pilih nama untuk kosakata kustom Anda.
-
Tentukan lokasi file audio atau file video Anda diAmazon S3:
-
Untuk lokasi file input Kosakata pada S3 di bawah pengaturan Kosakata, tentukanAmazon S3 URI yang mengidentifikasi file teks yang akan Anda gunakan untuk membuat kosakata khusus Anda.
-
Untuk lokasi file input Kosakata di S3, pilih Browse S3 untuk menelusuri file teks dan memilihnya.
-
-
Pilih Buat kosakata.
Anda dapat melihat status pemrosesan kosakata kustom Anda diAWS Management Console.
Untuk membuat kosakata kustom medis (API)
-
Untuk
StartTranscriptionJob
API, tentukan yang berikut ini.-
Untuk
LanguageCode
, tentukanen-US
. -
Untuk
VocabularyFileUri
, tentukanAmazon S3 lokasi file teks yang Anda gunakan untuk menentukan kosakata khusus Anda. -
Untuk
VocabularyName
, tentukan nama untuk kosakata khusus Anda. Nama yang Anda tentukan harus unik dalam AndaAkun AWS.
-
Untuk melihat status pemrosesan kosakata kustom Anda, gunakan GetMedicalVocabulary
API.
Berikut ini adalah contoh permintaan menggunakanAWS SDK for Python (Boto3) untuk membuat kosakata khusus.
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', '
us-west-2
') vocab_name = "my-first-vocabulary
" response = transcribe.create_medical_vocabulary( VocabularyName = job_name, VocabularyFileUri = 's3://DOC-EXAMPLE-BUCKET
/my-vocabularies
/my-vocabulary-table
.txt' LanguageCode = 'en-US', ) while True: status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
Untuk mengaktifkan partisi pembicara dalam pekerjaan transkripsi batch (AWS CLI)
-
Jalankan kode berikut.
aws transcribe create-medical-vocabulary \ --vocabulary-name
my-first-vocabulary
\ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET
/my-vocabularies
/my-vocabulary-file
.txt \ --language-codeen-US