テキストファイルを使用して医療カスタムボキャブラリーを作成する

カスタムボキャブラリーを作成するには、コレクションに単語やフレーズを含むテキストファイルを用意しておく必要があります。 Amazon TranscribeMedical では、このテキストファイルを使用してカスタムボキャブラリーを作成します。CreateMedicalVocabularyAPIAmazon Transcribe またはMedical コンソールを使用してカスタムボキャブラリーを作成できます。

AWS Management Consoleを使用してカスタムボキャブラリーを作成するには、単語またはフレーズを含むテキストファイルのAmazon S3 URI を指定します。

AWS Management Consoleにサインインします。
ナビゲーションペインのAmazon Transcribe Medical で、[カスタムボキャブラリー] を選択します。
名前を使用する場合、語彙の設定で、カスタムボキャブラリーの名前を選択します。
Amazon S3 でオーディオファイルまたはビデオファイルの場所を指定します。
- S3のボキャブラリー設定のボキャブラリー入力ファイルの場所で、カスタムボキャブラリーの作成に使用するテキストファイルを識別するAmazon S3 URI を指定します。
- S3のボキャブラリー入力ファイルの場所については、S3の参照を選択してテキストファイルを参照し、それを選択します。
[語彙の作成] を選択します。

カスタムボキャブラリーの処理ステータスがで確認できますAWS Management Console。

医学用語のカスタム語彙の作成 (API)

StartTranscriptionJob API では、以下のものを指定します。
1. LanguageCode には、en-US を指定します。
2. の場合VocabularyFileUri、Amazon S3カスタムボキャブラリーを定義するために使用するテキストファイルの場所を指定します。
3. VocabularyName の場合、カスタムボキャブラリーの名前を指定します。指定する名前は、AWS アカウント内で一意でなければなりません。

カスタムボキャブラリーの処理状況を表示する場合、GetMedicalVocabulary API を使用します。

以下は、カスタム語彙を作成するために AWS SDK for Python (Boto3) を使用したリクエスト例です。



from __future__ import print_function
import time
import boto3  
transcribe = boto3.client('transcribe', 'us-west-2')
vocab_name = "my-first-vocabulary"
response = transcribe.create_medical_vocabulary(
    VocabularyName = job_name,
    VocabularyFileUri = 's3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-table.txt'
    LanguageCode = 'en-US',
  )
  
while True:
    status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name)
    if status['VocabularyState'] in ['READY', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

バッチ文字起こしジョブ (AWS CLI) で話者の分割を有効にするには

以下のコードを実行します。



aws transcribe create-medical-vocabulary \
--vocabulary-name my-first-vocabulary \ 
--vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-file.txt \
--language-code en-US

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

医療カスタムボキャブラリー用のテキストファイルを作成する

医療用カスタムボキャブラリーを使用したオーディオファイルの文字起こし