使用 Amazon Chime SDK 实时转录 - Amazon Chime SDK

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon Chime SDK 实时转录

您可以使用 Amazon Chime SDK 实时转录生成用户归属的实时会议记录。Amazon Chime SDK 实时转录与 Amazon Transcribe 和 Amazon Transcribe Medical 服务集成,可在会议进行期间生成 Amazon Chime SDK 会议记录。

Amazon Chime SDK 实时转录分别处理每个用户的音频,以提高多人场景中的准确性。Amazon Chime SDK 使用其主动说话者算法来选择前两个主动说话者,然后通过单个流将其音频以不同的频道发送到 Amazon Transcribe。会议参与者通过 Amazon Chime SDK 数据消息接收用户归属的转录。您可以通过多种方式使用转录,例如显示字幕、创建会议记录或使用转录进行内容分析。

在会议转录期间,实时转录使用一个流到 Amazon Transcribe。适用标准 Amazon Transcribe 和 Amazon Transcribe Medical 费用。有关更多信息,请参阅 Amazon Transcribe 定价。有关使用量或账单的问题,请联系您的 AWS 客户经理。

重要

默认情况下,Amazon Transcribe 可能会使用和存储该服务处理的音频内容来开发和改进 AWS AI/ML 服务,详见服务条款第 50 节。AWS使用 Amazon Transcribe 时可能需要遵守联邦和州有关录制或拦截电子通信的法律或法规。您和您的最终用户有责任遵守与录音有关的所有适用法律,包括适当通知录制会话或通信中的所有参与者正在录制会话或通信,并获得他们的同意。通过 AWS 使用 Organizations 配置 AI 服务选择退出政策,您可以选择不使用音频内容来开发和改进 AWS AI/ML 服务。 AWS

系统架构

Amazon Chime SDK 通过与您的 Amazon Transcribe 或 Amazon Transcribe Medical 账户的服务端集成,创建实时会议转录,无需音频离开 AWS 网络。为了提高准确性,用户的音频会被单独处理,然后混合到会议中。Amazon Chime SDK 使用其主动说话者算法来选择前两个主动说话者,然后通过单个流将其的音频以不同的频道发送到 Amazon Transcribe 或 Amazon Transcribe Medical。为了减少延迟,用户归属的转录将通过数据消息直接发送给每位会议参与者。使用媒体管道捕获会议音频时,还会捕获会议的转录信息。

显示会议转录数据流的图表。

账单和使用情况

在会议转录期间,实时转录使用一个流到 Amazon Transcribe 或 Amazon Transcribe Medical。适用标准 Amazon Transcribe 和 Amazon Transcribe Medical 费用。有关更多信息,请参阅 Amazon Transcribe 定价。有关使用量或账单的问题,请联系您的 AWS 客户经理。

转录参数

Amazon Transcribe 和 Amazon Transcribe Medical API 在启动直播转录时提供了许多参数,例如和。StartStreamTranscriptionStartMedicalStreamTranscription您可以在 StartMeetingTranscription API 中使用这些参数,除非 Amazon Chime 软件开发工具包预先确定参数的值。例如,MediaEncodingMediaSampleRateHertz 参数不可用,因为 Amazon Chime SDK 会自动进行设置。

Amazon Transcribe 和 Amazon Transcribe Medical 对参数进行验证,以允许您在新的参数值可用后立即使用。例如,如果 Amazon Transcribe Medical 启动对新语言的支持,则您只需要在 LanguageCode 参数中指定新的语言值。