生成替代轉錄 - Amazon Transcribe

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

生成替代轉錄

當您使用「Amazon Transcribe醫療」時,您將獲得信心水平最高的轉錄。不過,您可以設定「Amazon Transcribe醫療」以傳回其他可信度較低的轉錄。

使用替代轉錄來查看所轉錄音訊的不同解釋。例如,在使用人員能夠審核轉錄的應用程式中,您可以提供可供人員選擇的替代轉錄。

您可以使用AWS Management Console或 StartMedicalTranscriptionJobAPI 產生替代轉錄。

若要使用AWS Management Console產生替代轉錄,請在設定工作時啟用替代結果。

  1. 登入 AWS Management Console

  2. 在導覽窗格的 MEDIAL (Amazon Transcribe醫療) 中,選擇 Tran( 轉錄工作)。

  3. 選擇 Create job (建立任務)。

  4. 在 [指定工作詳細資料] 頁面上,提供轉錄工作的相關資訊。

  5. 選擇 Next (下一步)。

  6. 啟用替代結果

  7. 在「最大」替代方案中,輸入介於 2 到 10 之間的整數值,以取得您要在輸出中輸出的替代轉錄數目上限。

  8. 選擇 Create (建立)。

使用批次轉錄工作 (API) 分隔音訊檔案中每位發言者的文字
  • 對於 StartMedicalTranscriptionJobAPI,請指定以下內容。

    1. 對於MedicalTranscriptionJobName,指定在您的中唯一的名稱AWS 帳戶。

    2. 對於LanguageCode,請指定與音訊檔案中所說語言相對應的語言代碼,以及字彙篩選器的語言。

    3. Media物件的MediaFileUri參數中,指定要轉錄的音訊檔案的位置。

    4. 對於Specialty,指定臨床醫生在音頻文件中說話的醫療專業。

    5. 對於Type,指定要轉錄醫學對話還是聽寫。

    6. 對於OutputBucketName,指定Amazon S3儲存轉錄結果的值區。

    7. 對於Settings物件,請指定下列項目。

      1. ShowAlternativestrue.

      2. MaxAlternatives-介於 2 到 10 之間的整數,用來指出轉錄輸出中所需的替代轉錄數。

下列要求會使用啟動AWS SDK for Python (Boto3)轉錄工作,該工作最多可產生兩個替代轉錄。

from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe', 'us-west-2') job_name = "my-first-transcription-job" job_uri = s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'DOC-EXAMPLE-BUCKET', OutputKey = 'my-output-files/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'CONVERSATION', Settings = { 'ShowAlternatives': True, 'MaxAlternatives': 2 } ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status)
在音頻文件中轉錄初級保健臨床醫生和患者之間對話的音頻文件(AWS CLI)
  • 執行下列程式碼。

    aws transcribe start-transcription-job \ --cli-input-json file://filepath/example-start-command.json

    下列程式碼顯示的內容example-start-command.json

    { "MedicalTranscriptionJobName": "my-first-transcription-job", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "CONVERSATION", "OutputBucketName":"DOC-EXAMPLE-BUCKET", "Media": { "MediaFileUri": "s3://DOC-EXAMPLE-BUCKET/my-input-files/my-audio-file.flac" }, "Settings":{ "ShowAlternatives": true, "MaxAlternatives": 2 } }