转录医学口述的音频文件 - Amazon Transcribe

转录医学口述的音频文件

使用批量转录作业转录医疗对话的音频文件。您可以用它来转录临床医生与患者的对话。您可以通过 StartMedicalTranscriptionJob API 或 AWS Management Console来启动批量转录作业。

使用 StartMedicalTranscriptionJob API 启动医疗转录作业时，您可以将 PRIMARYCARE 指定为 Specialty 参数的值。

转录临床医生与患者的对话（AWS Management Console）

要使用转录临床医生与患者的对话，请创建转录作业，然后选择对话作为音频输入类型。 AWS Management Console

登录到 AWS Management Console。
在导航窗格的 “ Amazon Transcribe 医疗” 下，选择 “转录作业”。
请选择创建任务。
在指定作业详细信息页面上的作业设置下，指定以下设置。
1. 名称 – 转录作业的名称。
2. 音频输入类型 – 口述
对于其余字段，请指定音频文件的 Amazon S3 位置以及要存储转录作业输出的位置。
选择下一步。
选择创建。

AWS Management Console

转录临床医生与患者的对话（AWS Management Console）

要使用转录临床医生与患者的对话，请创建转录作业，然后选择对话作为音频输入类型。 AWS Management Console

登录到 AWS Management Console。
在导航窗格的 “ Amazon Transcribe 医疗” 下，选择 “转录作业”。
请选择创建任务。
在指定作业详细信息页面上的作业设置下，指定以下设置。
1. 名称 – 转录作业的名称。
2. 音频输入类型 – 口述
对于其余字段，请指定音频文件的 Amazon S3 位置以及要存储转录作业输出的位置。
选择下一步。
选择创建。

使用批量转录作业转录医疗谈话 (API)

对于 StartMedicalTranscriptionJob API，请指定以下内容。

对于 MedicalTranscriptionJobName，请指定对于您 AWS 账户而言唯一的名称。
对于 LanguageCode，指定与音频文件中所用语言和词汇表筛选条件的语言对应的语言代码。
在 Media 对象的 MediaFileUri 参数中，指定要转录的音频文件的名称。
对于 Specialty，请指定音频文件中说话的临床医生的医学专科。
对于 Type，请指定 DICTATION。
对于 OutputBucketName，请指定要将转录结果存储到的 Amazon S3 存储桶。

以下是一个请求示例，该请求使用适用于 Python (Boto3) 的 AWS SDK 转录该专业临床医生的医疗听写。PRIMARYCARE



 from __future__ import print_function
 import time
 import boto3
 transcribe = boto3.client('transcribe')
 job_name = "my-first-med-transcription-job"
 job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
 transcribe.start_medical_transcription_job(
     MedicalTranscriptionJobName = job_name,
     Media = {
        'MediaFileUri': job_uri
     },     
     OutputBucketName = 'amzn-s3-demo-bucket',                                
     OutputKey = 'my-output-files/', 
     LanguageCode = 'en-US',
     Specialty = 'PRIMARYCARE',
     Type = 'DICTATION'
 )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

以下示例代码显示了医学口述的转录结果。



{
    "jobName": "dictation-medical-transcription-job",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "... came for a follow up visit today..."
            }
        ],
        "items": [
            {
            ...
                "start_time": "4.85",
                "end_time": "5.12",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "came"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.12",
                "end_time": "5.29",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "for"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.29",
                "end_time": "5.33",
                "alternatives": [
                    {
                        "confidence": "0.9955",
                        "content": "a"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.33",
                "end_time": "5.66",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "follow"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.66",
                "end_time": "5.75",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "up"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.75",
                "end_time": "6.02",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "visit"
                    }
                ]
                ...
    },
    "status": "COMPLETED"
}

API

使用批量转录作业转录医疗谈话 (API)

对于 StartMedicalTranscriptionJob API，请指定以下内容。

对于 MedicalTranscriptionJobName，请指定对于您 AWS 账户而言唯一的名称。
对于 LanguageCode，指定与音频文件中所用语言和词汇表筛选条件的语言对应的语言代码。
在 Media 对象的 MediaFileUri 参数中，指定要转录的音频文件的名称。
对于 Specialty，请指定音频文件中说话的临床医生的医学专科。
对于 Type，请指定 DICTATION。
对于 OutputBucketName，请指定要将转录结果存储到的 Amazon S3 存储桶。

以下是一个请求示例，该请求使用适用于 Python (Boto3) 的 AWS SDK 转录该专业临床医生的医疗听写。PRIMARYCARE



 from __future__ import print_function
 import time
 import boto3
 transcribe = boto3.client('transcribe')
 job_name = "my-first-med-transcription-job"
 job_uri = "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
 transcribe.start_medical_transcription_job(
     MedicalTranscriptionJobName = job_name,
     Media = {
        'MediaFileUri': job_uri
     },     
     OutputBucketName = 'amzn-s3-demo-bucket',                                
     OutputKey = 'my-output-files/', 
     LanguageCode = 'en-US',
     Specialty = 'PRIMARYCARE',
     Type = 'DICTATION'
 )
while True:
    status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name)
    if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']:
        break
    print("Not ready yet...")
    time.sleep(5)
print(status)

以下示例代码显示了医学口述的转录结果。



{
    "jobName": "dictation-medical-transcription-job",
    "accountId": "111122223333",
    "results": {
        "transcripts": [
            {
                "transcript": "... came for a follow up visit today..."
            }
        ],
        "items": [
            {
            ...
                "start_time": "4.85",
                "end_time": "5.12",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "came"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.12",
                "end_time": "5.29",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "for"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.29",
                "end_time": "5.33",
                "alternatives": [
                    {
                        "confidence": "0.9955",
                        "content": "a"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.33",
                "end_time": "5.66",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "follow"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.66",
                "end_time": "5.75",
                "alternatives": [
                    {
                        "confidence": "0.9754",
                        "content": "up"
                    }
                ],
                "type": "pronunciation"
            },
            {
                "start_time": "5.75",
                "end_time": "6.02",
                "alternatives": [
                    {
                        "confidence": "1.0",
                        "content": "visit"
                    }
                ]
                ...
    },
    "status": "COMPLETED"
}

在批量转录作业中启用发言者划分 (AWS CLI)

运行以下代码。



                    
aws transcribe start-medical-transcription-job \
--region us-west-2 \
--cli-input-json file://example-start-command.json

以下代码显示了 example-start-command.json 的内容。


{
      "MedicalTranscriptionJobName": "my-first-med-transcription-job",        
      "Media": {
      "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
      },
      "OutputBucketName": "amzn-s3-demo-bucket",
      "OutputKey": "my-output-files/", 
      "LanguageCode": "en-US",  
      "Specialty": "PRIMARYCARE",
      "Type": "DICTATION"
}

AWS CLI

在批量转录作业中启用发言者划分 (AWS CLI)

运行以下代码。



                    
aws transcribe start-medical-transcription-job \
--region us-west-2 \
--cli-input-json file://example-start-command.json

以下代码显示了 example-start-command.json 的内容。


{
      "MedicalTranscriptionJobName": "my-first-med-transcription-job",        
      "Media": {
      "MediaFileUri": "s3://amzn-s3-demo-bucket/my-input-files/my-audio-file.flac"
      },
      "OutputBucketName": "amzn-s3-demo-bucket",
      "OutputKey": "my-output-files/", 
      "LanguageCode": "en-US",  
      "Specialty": "PRIMARYCARE",
      "Type": "DICTATION"
}

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

转录医学口述

转录流式医学口述

选择您的 Cookie 首选项

自定义 Cookie 首选项

关键

性能

功能

广告

无法保存 Cookie 首选项

转录医学口述的音频文件

转录临床医生与患者的对话（AWS Management Console）

AWS Management Console

转录临床医生与患者的对话（AWS Management Console）

使用批量转录作业转录医疗谈话 (API)

API

使用批量转录作业转录医疗谈话 (API)

在批量转录作业中启用发言者划分 (AWS CLI)

AWS CLI

在批量转录作业中启用发言者划分 (AWS CLI)

此页内容对您是否有帮助？

下一主题：

上一主题：

需要帮助吗？