本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
StartMedicalStreamTranscription
启动双向 HTTP/2 或 WebSocket 流式传输,其中音频将流式传输到 Amazon Transcribe Medical,并且转录结果将流式传输到您的应用程序。
以下参数为必需参数:
-
language-code
-
media-encoding
-
sample-rate
有关使用 Amazon Transcribe Medical 进行直播的更多信息,请参阅转录流媒体音频。
请求语法
POST /medical-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"AudioStream": {
"AudioEvent": {
"AudioChunk": blob
}
}
}
URI 请求参数
请求使用以下 URI 参数。
- ContentIdentificationType
-
标记您的成绩单中标明的所有个人医疗信息 (PHI)。
内容识别是在片段级别上进行的;PHI 在音频片段完成转录后会被标记。
有关更多信息,请参阅识别转录中的个人健康信息 (PHI)。
有效值:
PHI
- EnableChannelIdentification
-
在多声道音频中启用频道识别。
频道识别可单独转录每个通道上的音频,然后将每个通道的输出附加到一个脚本中。
如果您有多声道音频但未启用频道识别,则您的音频将以连续的方式转录,并且您的转录不会按频道分隔。
如果您在请求
EnableChannelIdentification
中包含内容,则还必须包括NumberOfChannels
。有关更多信息,请参阅转录多声道音频。
- LanguageCode
-
指定代表音频中所说语言的语言代码。
重要
Amazon Transcribe Medical 仅支持美国英语 (
en-US
)。有效值:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
必需:是
- MediaEncoding
-
指定用于输入音频的编码。支持的格式为:
-
FLAC
-
Ogg 容器中的 Opus 编码音频
-
PCM(仅限签名的 16 位小端音频格式,不包括 WAV)
有关更多信息,请参阅媒体格式。
有效值:
pcm | ogg-opus | flac
必需:是
-
- MediaSampleRateHertz
-
输入音频的采样率(以赫兹为单位)。Amazon Transcribe Medical 支持从 16,000 Hz 到 48,000 Hz 不等的频率。请注意,您指定的采样率必须与音频的采样率相匹配。
有效范围:最小值为 8000。最大值为 48000。
必需:是
- NumberOfChannels
-
指定音频流中的通道数量。此值必须为
2
,因为仅支持两个通道。如果您的音频不包含多个频道,请不要在请求中包含此参数。如果您在请求
NumberOfChannels
中包含内容,则还必须包括EnableChannelIdentification
。有效范围:最小值为 2。
- SessionId
-
为您的转录会话指定一个名称。如果您在请求中未包含此参数,Amazon Transcribe Medical 会生成一个 ID 并在响应中将其返回。
长度限制:固定长度为 36。
模式:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
在转录输出中启用扬声器分区(分音)。扬声器分区会标记媒体文件中单个扬声器的语音。
有关更多信息,请参阅对扬声器进行分区(分区)。
- Specialty
-
指定音频中包含的医学专业。
有效值:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY
必需:是
- Type
-
指定输入音频的类型。例如,选择
DICTATION
提供者口述患者记录,选择患者与CONVERSATION
医疗专业人员之间的对话。有效值:
CONVERSATION | DICTATION
必需:是
- VocabularyName
-
指定处理转录时要使用的自定义词汇的名称。请注意,词汇名称区分大小写。
长度限制:最小长度为 1。最大长度为 200。
模式:
^[0-9a-zA-Z._-]+
请求正文
请求接受采用 JSON 格式的以下数据。
- AudioStream
-
经过编码的音频 blob 流。音频流编码为 HTTP/2 或 WebSocket 数据帧。
有关更多信息,请参阅转录流式音频。
类型:AudioStream 对象
必需:是
响应语法
HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json
{
"TranscriptResultStream": {
"BadRequestException": {
},
"ConflictException": {
},
"InternalFailureException": {
},
"LimitExceededException": {
},
"ServiceUnavailableException": {
},
"TranscriptEvent": {
"Transcript": {
"Results": [
{
"Alternatives": [
{
"Entities": [
{
"Category": "string",
"Confidence": number,
"Content": "string",
"EndTime": number,
"StartTime": number
}
],
"Items": [
{
"Confidence": number,
"Content": "string",
"EndTime": number,
"Speaker": "string",
"StartTime": number,
"Type": "string"
}
],
"Transcript": "string"
}
],
"ChannelId": "string",
"EndTime": number,
"IsPartial": boolean,
"ResultId": "string",
"StartTime": number
}
]
}
}
}
}
响应元素
如果此操作成功,则该服务将会发送回 HTTP 200 响应。
响应将返回以下 HTTP 标头。
- ContentIdentificationType
-
显示您的转录是否启用了内容识别。
有效值:
PHI
- EnableChannelIdentification
-
显示您的转录是否启用了频道识别。
- LanguageCode
-
提供您在请求中指定的语言代码。必须是
en-US
。有效值:
en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR | ja-JP | ko-KR | zh-CN | hi-IN | th-TH
- MediaEncoding
-
提供您在请求中指定的媒体编码。
有效值:
pcm | ogg-opus | flac
- MediaSampleRateHertz
-
提供您在请求中指定的采样率。
有效范围:最小值为 8000。最大值为 48000。
- NumberOfChannels
-
提供您在请求中指定的频道数量。
有效范围:最小值为 2。
- RequestId
-
为您的直播请求提供标识符。
- SessionId
-
为您的转录会话提供标识符。
长度限制:固定长度为 36。
模式:
[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}
- ShowSpeakerLabel
-
显示您的转录是否启用了扬声器分区。
- Specialty
-
提供您在申请中指定的医学专业。
有效值:
PRIMARYCARE | CARDIOLOGY | NEUROLOGY | ONCOLOGY | RADIOLOGY | UROLOGY
- Type
-
提供您在请求中指定的音频类型。
有效值:
CONVERSATION | DICTATION
- VocabularyName
-
提供您在请求中指定的自定义词汇表的名称。
长度限制:最小长度为 1。最大长度为 200。
模式:
^[0-9a-zA-Z._-]+
服务以 JSON 格式返回的以下数据。
- TranscriptResultStream
-
提供有关您的流式传输会话的详细信息。
错误
有关所有操作常见错误的信息,请参阅常见错误。
- BadRequestException
-
StartStreamTranscription
、StartMedicalStreamTranscription
或StartCallAnalyticsStreamTranscription
操作的一个或多个参数无效。例如,MediaEncoding
或LanguageCode
使用了不支持的值。检查指定的参数,然后重试您的请求。HTTP 状态代码:400
- ConflictException
-
一个新的直播以相同的会话 ID 开始。当前直播已终止。
HTTP 状态代码:409
- InternalFailureException
-
处理音频时出现问题。Amazon Transcribe 已终止处理。
HTTP 状态代码:500
- LimitExceededException
-
您的客户已超过Amazon Transcribe 其中一个限制。这通常是音频长度限制。将您的音频流分成小块,然后重试您的请求。
HTTP 状态代码:429
- ServiceUnavailableException
-
服务目前无法使用。稍后尝试您的请求。
HTTP 状态代码:503
另请参阅
有关在特定语言的 AWS 软件开发工具包中使用此 API 的更多信息,请参阅以下内容: