本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
转录医学口述的音频文件
使用批量转录作业转录医疗对话的音频文件。您可以用它来转录临床医生与患者的对话。您可以通过 StartMedicalTranscriptionJob
API 或 AWS Management Console来启动批量转录作业。
使用 StartMedicalTranscriptionJob
API 启动医疗转录作业时,您可以将 PRIMARYCARE
指定为 Specialty
参数的值。
转录临床医生与患者的对话(AWS Management Console)
要使用转录临床医生与患者的对话,请创建转录作业,然后选择对话作为音频输入类型。 AWS Management Console
-
在导航窗格的 “ Amazon Transcribe 医疗” 下,选择 “转录作业”。
-
请选择创建任务。
-
在指定作业详细信息页面上的作业设置下,指定以下设置。
-
名称 – 转录作业的名称。
-
音频输入类型 – 口述
-
-
对于其余字段,请指定音频文件的 Amazon S3 位置以及要存储转录作业输出的位置。
-
选择下一步。
-
选择创建。
使用批量转录作业转录医疗谈话 (API)
-
对于
StartMedicalTranscriptionJob
API,请指定以下内容。-
对于
MedicalTranscriptionJobName
,请指定对于您 AWS 账户而言唯一的名称。 -
对于
LanguageCode
,指定与音频文件中所用语言和词汇表筛选条件的语言对应的语言代码。 -
在
Media
对象的MediaFileUri
参数中,指定要转录的音频文件的名称。 -
对于
Specialty
,请指定音频文件中说话的临床医生的医学专科。 -
对于
Type
,请指定DICTATION
。 -
对于
OutputBucketName
,请指定要将转录结果存储到的 Amazon S3 存储桶。
以下是一个请求示例,该请求使用 适用于 Python (Boto3) 的 AWS SDK 转录该专业临床医生的医疗听写。
PRIMARYCARE
from __future__ import print_function import time import boto3 transcribe = boto3.client('transcribe') job_name = "
my-first-med-transcription-job
" job_uri = "s3://amzn-s3-demo-bucket
/my-input-files
/my-audio-file
.flac
" transcribe.start_medical_transcription_job( MedicalTranscriptionJobName = job_name, Media = { 'MediaFileUri': job_uri }, OutputBucketName = 'amzn-s3-demo-bucket
', OutputKey = 'my-output-files
/', LanguageCode = 'en-US', Specialty = 'PRIMARYCARE', Type = 'DICTATION' ) while True: status = transcribe.get_medical_transcription_job(MedicalTranscriptionJobName = job_name) if status['MedicalTranscriptionJob']['TranscriptionJobStatus'] in ['COMPLETED', 'FAILED']: break print("Not ready yet...") time.sleep(5) print(status) -
以下示例代码显示了医学口述的转录结果。
{
"jobName": "dictation-medical-transcription-job",
"accountId": "111122223333
",
"results": {
"transcripts": [
{
"transcript": "... came for a follow up visit today..."
}
],
"items": [
{
...
"start_time": "4.85",
"end_time": "5.12",
"alternatives": [
{
"confidence": "1.0",
"content": "came"
}
],
"type": "pronunciation"
},
{
"start_time": "5.12",
"end_time": "5.29",
"alternatives": [
{
"confidence": "1.0",
"content": "for"
}
],
"type": "pronunciation"
},
{
"start_time": "5.29",
"end_time": "5.33",
"alternatives": [
{
"confidence": "0.9955",
"content": "a"
}
],
"type": "pronunciation"
},
{
"start_time": "5.33",
"end_time": "5.66",
"alternatives": [
{
"confidence": "0.9754",
"content": "follow"
}
],
"type": "pronunciation"
},
{
"start_time": "5.66",
"end_time": "5.75",
"alternatives": [
{
"confidence": "0.9754",
"content": "up"
}
],
"type": "pronunciation"
},
{
"start_time": "5.75",
"end_time": "6.02",
"alternatives": [
{
"confidence": "1.0",
"content": "visit"
}
]
...
},
"status": "COMPLETED"
}
在批量转录作业中启用发言者划分 (AWS CLI)
-
运行以下代码。
aws transcribe start-medical-transcription-job \ --region
us-west-2
\ --cli-input-json file://example-start-command
.json以下代码显示了
example-start-command.json
的内容。{ "MedicalTranscriptionJobName": "
my-first-med-transcription-job
", "Media": { "MediaFileUri": "s3://amzn-s3-demo-bucket
/my-input-files
/my-audio-file
.flac
" }, "OutputBucketName": "amzn-s3-demo-bucket
", "OutputKey": "my-output-files
/", "LanguageCode": "en-US", "Specialty": "PRIMARYCARE", "Type": "DICTATION" }