轉錄醫療聽寫的音頻文件 - Amazon Transcribe

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

轉錄醫療聽寫的音頻文件

使用批量轉錄工作轉錄醫療對話的音頻文件。您可以使用它來轉錄臨床醫生與患者的對話。您可以在 StartMedicalTranscriptionJobAPI 或AWS Management Console.

當您使用 StartMedicalTranscriptionJobAPI 開始醫療轉錄工作時,您會指定PRIMARYCARESpecialty參數的值。

轉錄臨床醫生與患者的對話(AWS Management Console)

若要使用AWS Management Console轉錄臨床醫生與病人對話,請建立轉錄工作,然後針對 [音訊] 輸入類型選擇 [交談]。

  1. 登入 AWS Management Console

  2. 在導覽窗格中的Amazon Transcribe醫療下,選擇轉錄工作

  3. 選擇 Create job (建立任務)。

  4. 在 [指定 Job 詳細資訊] 頁面的 [工作設定] 下,指定下列項目。

    1. 名稱 — 轉錄工作的名稱。

    2. 音訊輸入類型聽寫

  5. 對於其餘欄Amazon S3位,請指定音訊檔案的位置,以及要儲存轉錄工作輸出的位置。

  6. 選擇 Next (下一步)。

  7. 選擇 Create (建立)。

使用批次轉錄工作 (API) 轉錄醫學對話
  • 對於 StartMedicalTranscriptionJobAPI,請指定以下內容。

    1. 對於MedicalTranscriptionJobName,指定在您的AWS 帳戶.

    2. 對於LanguageCode,請指定與音訊檔案中所說語言相對應的語言代碼,以及字彙篩選器的語言。

    3. Media物件的MediaFileUri參數中,指定您要轉錄的音訊檔案名稱。

    4. 對於Specialty,指定臨床醫生在音頻文件中說話的醫療專業。

    5. Type,請指定 DICTATION

    6. 對於OutputBucketName,指定Amazon S3儲存轉錄結果的值區。

    以下是使用轉錄PRIMARYCARE專業臨床醫師的醫療聽寫的示例請求。AWS SDK for Python (Boto3)

    from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "my-first-med-transcription-job" job_uri = "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'DICTATION' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)

下列範例程式碼顯示醫療聽寫的轉錄結果。

{ "jobName": "dictation-medical-transcription-job", "accountId": "111122223333", "results": { "transcripts": [ { "transcript": "... came for a follow up visit today..." } ], "items": [ { ... "start_time": "4.85", "end_time": "5.12", "alternatives": [ { "confidence": "1.0", "content": "came" } ], "type": "pronunciation" }, { "start_time": "5.12", "end_time": "5.29", "alternatives": [ { "confidence": "1.0", "content": "for" } ], "type": "pronunciation" }, { "start_time": "5.29", "end_time": "5.33", "alternatives": [ { "confidence": "0.9955", "content": "a" } ], "type": "pronunciation" }, { "start_time": "5.33", "end_time": "5.66", "alternatives": [ { "confidence": "0.9754", "content": "follow" } ], "type": "pronunciation" }, { "start_time": "5.66", "end_time": "5.75", "alternatives": [ { "confidence": "0.9754", "content": "up" } ], "type": "pronunciation" }, { "start_time": "5.75", "end_time": "6.02", "alternatives": [ { "confidence": "1.0", "content": "visit" } ] ... }, "status": "COMPLETED" }
在批次轉錄工作中啟用喇叭分割 (AWS CLI)
  • 執行下列程式碼。

    aws transcribe start-medical-transcription-job \ --region us-west-2 \ --cli-input-json file://example-start-command.json

    下列程式碼顯示的內容example-start-command.json

    { "MedicalTranscriptionJobName": "my-first-med-transcription-job", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" }, "OutputBucketName": "DOC-EXAMPLE-BUCKET", "OutputKey": "my-output-files/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }