StartMedicalStreamTranscription

启动双向 HTTP/2 或 WebSocket 流式传输，其中音频将流式传输到 Amazon Transcribe Medical，并且转录结果将流式传输到您的应用程序。

以下参数为必需参数：

language-code
media-encoding
sample-rate

有关使用 Amazon Transcribe Medical 进行直播的更多信息，请参阅转录流媒体音频。

请求语法


POST /medical-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json

{
   "AudioStream": { 
      "AudioEvent": { 
         "AudioChunk": blob
      }
   }
}

URI 请求参数

请求使用以下 URI 参数。

ContentIdentificationType

标记您的成绩单中标明的所有个人医疗信息 (PHI)。

内容识别是在片段级别上进行的；PHI 在音频片段完成转录后会被标记。

有关更多信息，请参阅识别转录中的个人健康信息 (PHI)。

有效值: PHI

EnableChannelIdentification

在多声道音频中启用频道识别。

频道识别可单独转录每个通道上的音频，然后将每个通道的输出附加到一个脚本中。

如果您有多声道音频但未启用频道识别，则您的音频将以连续的方式转录，并且您的转录不会按频道分隔。

如果您在请求EnableChannelIdentification中包含内容，则还必须包括NumberOfChannels。

有关更多信息，请参阅转录多声道音频。

LanguageCode

指定代表音频中所说语言的语言代码。

重要

Amazon Transcribe Medical 仅支持美国英语 (en-US)。

必需：是

MediaEncoding

指定用于输入音频的编码。支持的格式为：

FLAC
Ogg 容器中的 Opus 编码音频
PCM（仅限签名的 16 位小端音频格式，不包括 WAV）

有关更多信息，请参阅媒体格式。

有效值: pcm | ogg-opus | flac

必需：是

MediaSampleRateHertz

输入音频的采样率（以赫兹为单位）。Amazon Transcribe Medical 支持从 16,000 Hz 到 48,000 Hz 不等的频率。请注意，您指定的采样率必须与音频的采样率相匹配。

有效范围：最小值为 8000。最大值为 48000。

必需：是

NumberOfChannels

指定音频流中的通道数量。此值必须为2，因为仅支持两个通道。如果您的音频不包含多个频道，请不要在请求中包含此参数。

如果您在请求NumberOfChannels中包含内容，则还必须包括EnableChannelIdentification。

有效范围：最小值为 2。

SessionId

为您的转录会话指定一个名称。如果您在请求中未包含此参数，Amazon Transcribe Medical 会生成一个 ID 并在响应中将其返回。

长度限制：固定长度为 36。

模式：[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

在转录输出中启用扬声器分区（分音）。扬声器分区会标记媒体文件中单个扬声器的语音。

有关更多信息，请参阅对扬声器进行分区（分区）。

Specialty

指定音频中包含的医学专业。

必需：是

Type

指定输入音频的类型。例如，选择DICTATION提供者口述患者记录，选择患者与CONVERSATION医疗专业人员之间的对话。

有效值: CONVERSATION | DICTATION

必需：是

VocabularyName

指定处理转录时要使用的自定义词汇的名称。请注意，词汇名称区分大小写。

长度限制：最小长度为 1。最大长度为 200。

模式：^[0-9a-zA-Z._-]+

请求正文

请求接受采用 JSON 格式的以下数据。

AudioStream

经过编码的音频 blob 流。音频流编码为 HTTP/2 或 WebSocket 数据帧。

有关更多信息，请参阅转录流式音频。

类型：AudioStream 对象

必需：是

响应语法


HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-specialty: Specialty
x-amzn-transcribe-type: Type
x-amzn-transcribe-show-speaker-label: ShowSpeakerLabel
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-enable-channel-identification: EnableChannelIdentification
x-amzn-transcribe-number-of-channels: NumberOfChannels
x-amzn-transcribe-content-identification-type: ContentIdentificationType
Content-type: application/json

{
   "TranscriptResultStream": { 
      "BadRequestException": { 
      },
      "ConflictException": { 
      },
      "InternalFailureException": { 
      },
      "LimitExceededException": { 
      },
      "ServiceUnavailableException": { 
      },
      "TranscriptEvent": { 
         "Transcript": { 
            "Results": [ 
               { 
                  "Alternatives": [ 
                     { 
                        "Entities": [ 
                           { 
                              "Category": "string",
                              "Confidence": number,
                              "Content": "string",
                              "EndTime": number,
                              "StartTime": number
                           }
                        ],
                        "Items": [ 
                           { 
                              "Confidence": number,
                              "Content": "string",
                              "EndTime": number,
                              "Speaker": "string",
                              "StartTime": number,
                              "Type": "string"
                           }
                        ],
                        "Transcript": "string"
                     }
                  ],
                  "ChannelId": "string",
                  "EndTime": number,
                  "IsPartial": boolean,
                  "ResultId": "string",
                  "StartTime": number
               }
            ]
         }
      }
   }
}

响应元素

如果此操作成功，则该服务将会发送回 HTTP 200 响应。

响应将返回以下 HTTP 标头。

ContentIdentificationType

显示您的转录是否启用了内容识别。

有效值: PHI

EnableChannelIdentification

显示您的转录是否启用了频道识别。

LanguageCode

提供您在请求中指定的语言代码。必须是 en-US。

MediaEncoding

提供您在请求中指定的媒体编码。

有效值: pcm | ogg-opus | flac

MediaSampleRateHertz

提供您在请求中指定的采样率。

有效范围：最小值为 8000。最大值为 48000。

NumberOfChannels

提供您在请求中指定的频道数量。

有效范围：最小值为 2。

RequestId

为您的直播请求提供标识符。

SessionId

为您的转录会话提供标识符。

长度限制：固定长度为 36。

模式：[a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

ShowSpeakerLabel

显示您的转录是否启用了扬声器分区。

Specialty

提供您在申请中指定的医学专业。

Type

提供您在请求中指定的音频类型。

有效值: CONVERSATION | DICTATION

VocabularyName

提供您在请求中指定的自定义词汇表的名称。

长度限制：最小长度为 1。最大长度为 200。

模式：^[0-9a-zA-Z._-]+

服务以 JSON 格式返回的以下数据。

TranscriptResultStream

提供有关您的流式传输会话的详细信息。

类型：MedicalTranscriptResultStream 对象

错误

有关所有操作常见错误的信息，请参阅常见错误。

BadRequestException

StartStreamTranscription、StartMedicalStreamTranscription或StartCallAnalyticsStreamTranscription操作的一个或多个参数无效。例如，MediaEncoding或LanguageCode使用了不支持的值。检查指定的参数，然后重试您的请求。

HTTP 状态代码：400

ConflictException

一个新的直播以相同的会话 ID 开始。当前直播已终止。

HTTP 状态代码：409

InternalFailureException

处理音频时出现问题。Amazon Transcribe 已终止处理。

HTTP 状态代码：500

LimitExceededException

您的客户已超过Amazon Transcribe 其中一个限制。这通常是音频长度限制。将您的音频流分成小块，然后重试您的请求。

HTTP 状态代码：429

ServiceUnavailableException

服务目前无法使用。稍后尝试您的请求。

HTTP 状态代码：503

另请参阅

有关在特定语言的 AWS 软件开发工具包中使用此 API 的更多信息，请参阅以下内容：

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

StartCallAnalyticsStreamTranscription

StartStreamTranscription