代替文字起こしの生成

Amazon Transcribe Medical を使用すると、信頼度が最も高い文字起こしが得られます。ただし、信頼性レベルが低い追加の文字起こしを返すように Amazon Transcribe Medical を設定できます。

代替文字起こしを使用して、変換された音声のさまざまな解釈を確認します。たとえば、ユーザーが文字起こしをレビューできるアプリケーションでは、選択できる代替文字起こしを提示できます。

AWS Management Console または StartMedicalTranscriptionJob API を使用して代替文字起こしを生成できます。

を使用して代替文字起こし AWS Management Console を生成するには、ジョブを設定するときに代替結果を有効にします。

AWS Management Consoleにサインインします。
ナビゲーションペインの Amazon Transcribe Medical で、文字起こしジョブを選択します。
[ジョブの作成]を選択します。
[ジョブの詳細を指定する] ページで、文字起こしジョブに関する情報を入力します。
[Next (次へ)] を選択します。
[代替結果] を有効にする。
[代替の最大数] には、2 から 10 までの整数値を入力して、出力に必要な代替文字起こしの最大数を指定します。
[Create] (作成) を選択します。

バッチ文字起こしジョブ (API) を使用して、音声ファイル内のスピーカーごとにテキストを分離する

StartMedicalTranscriptionJob API では、以下のものを指定します。
1. MedicalTranscriptionJobName の場合、 AWS アカウントで一意の名前を指定します。
2. LanguageCode として、音声ファイルで話されている言語と語彙フィルターの言語に対応する言語コードを指定します。
3. MediaFileUri オブジェクトの Media パラメータで、文字起こしする音声ファイルの場所を指定します。
4. Specialty の場合、音声ファイルで話す臨床医の専門分野を指定します。
5. Type の場合、医療会話を文字起こしするか、口述を筆記するかを指定します。
6. OutputBucketName の場合、トランスクリプション結果を保存する Amazon S3 バケットを指定します。
7. Settings オブジェクトの場合、以下を指定します。
  1. ShowAlternatives – true.
  2. MaxAlternatives - 2 から 10 までの整数値で、文字起こし出力に必要な代替文字起こしの数を示します。

次のリクエストでは、 AWS SDK for Python (Boto3) を使用して、最大 2 つの代替文字起こしを生成する文字起こしジョブを開始します。



from __future__ import print_function
import time
import boto3
transcribe = boto3.client('transcribe', 'us-west-2')
job_name = "my-first-transcription-job"
job_uri = s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac
transcribe.start_medical_transcription_job(
    MedicalTranscriptionJobName = job_name,
    Media = {
        'MediaFileUri': job_uri
    },
    OutputBucketName = 'amzn-s3-demo-bucket',
    OutputKey = 'my-output-files/', 
    LanguageCode = 'en-US',
    Specialty = 'PRIMARYCARE',
    Type = 'CONVERSATION', 
    Settings = {
        'ShowAlternatives': True,
        'MaxAlternatives': 2
    }
)

while True:
   status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
   if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
       break
   print("Not ready yet...")
   time.sleep(5)
print(status)

プライマリケアを実践している臨床医と患者との間の会話を音声ファイルに文字起こしする (AWS CLI)

以下のコードを実行します。


                    
aws transcribe start-transcription-job \
--cli-input-json file://filepath/example-start-command.json

以下のコードは、example-start-command.json の内容を示しています。



{
      "MedicalTranscriptionJobName": "my-first-transcription-job",
      "LanguageCode": "en-US",
      "Specialty": "PRIMARYCARE",
      "Type": "CONVERSATION",
      "OutputBucketName":"amzn-s3-demo-bucket",
      "Media": {
          "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
        },
      "Settings":{
          "ShowAlternatives": true,
          "MaxAlternatives": 2
        }
}

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

リアルタイムストリームでの PHI の識別

VPC エンドポイント (AWS PrivateLink)