メディカルディクテーションのオーディオファイルの文字起こし - Amazon Transcribe

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

メディカルディクテーションのオーディオファイルの文字起こし

バッチ文字起こしジョブを使用して、医療会話のオーディオファイルを文字起こしします。これを使用して、臨床医と患者の対話を文字起こしすることができます。StartMedicalTranscriptionJobAPI またはでバッチ文字起こしジョブを開始できますAWS Management Console。

StartMedicalTranscriptionJob API で医療分野の文字起こしジョブを開始する場合、PRIMARYCARESpecialty パラメータの値として指定します。

臨床医と患者の対話の文字起こし (AWS Management Console) の文字起こし

AWS Management Consoleを使用して臨床医と患者の対話を書き起こす場合、文字起こしジョブを作成し、オーディオ入力タイプ会話を選択します。

  1. AWS Management Consoleにサインインします。

  2. ナビゲーションペインのAmazon Transcribe Medical で、[文字起こしジョブ] を選択します。

  3. [Create job (ジョブの作成)] を選択します。

  4. ジョブ詳細を指定 ページ内の ジョブ設定 で次の指定を行います。

    1. 名前: 文字起こしジョブの名前です。

    2. オーディオ入力タイプ: ディクテーション

  5. 残りのフィールドには、Amazon S3オーディオファイルの場所と、文字起こしジョブの出力を保存する場所を指定します。

  6. [Next (次へ)] を選択します。

  7. [作成] を選択します。

バッチ文字起こしジョブ (API) を使用した医療会話の文字起こし
  • StartMedicalTranscriptionJob API では、以下のものを指定します。

    1. MedicalTranscriptionJobName の場合、AWS アカウント で一意の名前を指定します。

    2. LanguageCode として、音声ファイルで話されている言語と語彙フィルターの言語に対応する言語コードを指定します。

    3. MediaFileUri オブジェクトの Media パラメータに、文字起こしを行うメディアファイルの名前を指定します。

    4. Specialty の場合、音声ファイルで話す臨床医の専門分野を指定します。

    5. Type には、DICTATION を指定します。

    6. にはOutputBucketName、Amazon S3文字起こし結果を保存するバケットを指定します。

    以下は、AWS SDK for Python (Boto3) を使用して、PRIMARYCARE を専門とする臨床医のメディカルディクテーションを文字起こしするリクエストの例です。

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-med-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'DICTATION' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

次のコード例は、メディカルディクテーションの書き起こし結果を示しています。

{ "jobName": "dictation-medical-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "... came for a follow up visit today..." } ], "items": [ { ... "start_time": "4.85", "end_time": "5.12", "alternatives": [ { "confidence": "1.0", "content": "came" } ], "type": "pronunciation" }, { "start_time": "5.12", "end_time": "5.29", "alternatives": [ { "confidence": "1.0", "content": "for" } ], "type": "pronunciation" }, { "start_time": "5.29", "end_time": "5.33", "alternatives": [ { "confidence": "0.9955", "content": "a" } ], "type": "pronunciation" }, { "start_time": "5.33", "end_time": "5.66", "alternatives": [ { "confidence": "0.9754", "content": "follow" } ], "type": "pronunciation" }, { "start_time": "5.66", "end_time": "5.75", "alternatives": [ { "confidence": "0.9754", "content": "up" } ], "type": "pronunciation" }, { "start_time": "5.75", "end_time": "6.02", "alternatives": [ { "confidence": "1.0", "content": "visit" } ] ... }, "status": "COMPLETED" }
バッチ文字起こしジョブ (でででででで会話の文字起こしジョブAWS CLI) でスピーカーの分割を有効にするには
  • 以下のコードを実行します。

    aws transcribe start-medical-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    以下のコードは、example-start-command.json の内容を示しています。

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }