テキストファイルを使用して医療カスタムボキャブラリーを作成する - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

テキストファイルを使用して医療カスタムボキャブラリーを作成する

カスタムボキャブラリーを作成するには、コレクションに単語やフレーズを含むテキストファイルを用意しておく必要があります。 Amazon TranscribeMedical では、このテキストファイルを使用してカスタムボキャブラリーを作成します。CreateMedicalVocabularyAPIAmazon Transcribe またはMedical コンソールを使用してカスタムボキャブラリーを作成できます。

AWS Management Consoleを使用してカスタムボキャブラリーを作成するには、単語またはフレーズを含むテキストファイルのAmazon S3 URI を指定します。

  1. AWS Management Consoleにサインインします。

  2. ナビゲーションペインのAmazon Transcribe Medical で、[カスタムボキャブラリー] を選択します。

  3. 名前 を使用する場合、語彙の設定で、カスタムボキャブラリーの名前を選択します。

  4. Amazon S3 でオーディオファイルまたはビデオファイルの場所を指定します。

    • S3のボキャブラリー設定のボキャブラリー入力ファイルの場所で、カスタムボキャブラリーの作成に使用するテキストファイルを識別するAmazon S3 URI を指定します。

    • S3のボキャブラリー入力ファイルの場所については、S3の参照を選択してテキストファイルを参照し、それを選択します。

  5. [語彙の作成] を選択します。

カスタムボキャブラリーの処理ステータスがで確認できますAWS Management Console。

医学用語のカスタム語彙の作成 (API)
  • StartTranscriptionJob API では、以下のものを指定します。

    1. LanguageCode には、en-US を指定します。

    2. の場合VocabularyFileUri、Amazon S3カスタムボキャブラリーを定義するために使用するテキストファイルの場所を指定します。

    3. VocabularyName の場合、カスタムボキャブラリーの名前を指定します。指定する名前は、AWS アカウント 内で一意でなければなりません。

カスタムボキャブラリーの処理状況を表示する場合、GetMedicalVocabulary API を使用します。

以下は、カスタム語彙を作成するために AWS SDK for Python (Boto3) を使用したリクエスト例です。

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') vocab_name = "my-first-vocabulary" response = transcribe.create_medical_vocabulary( VocabularyName = job_name, VocabularyFileUri = 's3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-table.txt' LanguageCode = 'en-US', ) while True: status = transcribe.get_medical_vocabulary(VocabularyName = vocab_name) if status['VocabularyState'] in ['READY', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
バッチ文字起こしジョブ (AWS CLI) で話者の分割を有効にするには
  • 以下の コードを実行します。

    aws transcribe create-medical-vocabulary \ --vocabulary-name my-first-vocabulary \ --vocabulary-file-uri s3://DOC-EXAMPLE-BUCKET/my-vocabularies/my-vocabulary-file.txt \ --language-code en-US