Menggunakan file teks untuk membuat kosakata khusus medis

Untuk membuat kosakata kustom, Anda harus telah menyiapkan file teks yang berisi koleksi kata atau frasa. Amazon Transcribe Medis menggunakan file teks ini untuk membuat kosakata khusus yang dapat Anda gunakan untuk meningkatkan akurasi transkripsi kata atau frasa tersebut. Anda dapat membuat kosakata khusus menggunakan CreateMedicalVocabularyAPI atau konsolAmazon Transcribe Medis.

Untuk menggunakanAWS Management Console untuk membuat kosakata kustom, Anda menyediakanAmazon S3 URI dari file teks yang berisi kata-kata atau frasa Anda.

Masuk ke AWS Management Console.
Dalam panel navigasi, di bawahAmazon Transcribe Medis, pilih Kosakata khusus.
Untuk Nama, di bawah pengaturan Kosakata, pilih nama untuk kosakata kustom Anda.
Tentukan lokasi file audio atau file video Anda diAmazon S3:
- Untuk lokasi file input Kosakata pada S3 di bawah pengaturan Kosakata, tentukanAmazon S3 URI yang mengidentifikasi file teks yang akan Anda gunakan untuk membuat kosakata khusus Anda.
- Untuk lokasi file input Kosakata di S3, pilih Browse S3 untuk menelusuri file teks dan memilihnya.
Pilih Buat kosakata.

Anda dapat melihat status pemrosesan kosakata kustom Anda diAWS Management Console.

Untuk membuat kosakata kustom medis (API)

Untuk StartTranscriptionJobAPI, tentukan yang berikut ini.
1. Untuk LanguageCode, tentukan en-US.
2. UntukVocabularyFileUri, tentukanAmazon S3 lokasi file teks yang Anda gunakan untuk menentukan kosakata khusus Anda.
3. UntukVocabularyName, tentukan nama untuk kosakata khusus Anda. Nama yang Anda tentukan harus unik dalam AndaAkun AWS.

Untuk melihat status pemrosesan kosakata kustom Anda, gunakan GetMedicalVocabularyAPI.

Berikut ini adalah contoh permintaan menggunakanAWS SDK for Python (Boto3) untuk membuat kosakata khusus.



from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

Untuk mengaktifkan partisi pembicara dalam pekerjaan transkripsi batch (AWS CLI)

Jalankan kode berikut.



aws transcribe create-medical-vocabulary \
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Membuat file teks untuk kosakata kustom medis Anda

Mentranskripsikan file audio menggunakan kosakata khusus medis