了解 Amazon Chime SDK 的发言人搜索工作流程

聚焦模式

了解 Amazon Chime SDK 的发言人搜索工作流程 - Amazon Chime SDK

在本节中，我们会展示 Amazon Chime SDK 发言人搜索分析的示例数据和程序流。

发言人搜索功能涉及创建语音嵌入，该嵌入可用于比较呼叫者的语音与先前存储的语音数据。以数字声纹的形式收集、使用、存储和保留生物识别标识符和生物识别信息，可能需要以书面形式获得呼叫者的知情同意。根据各种州法律，包括伊利诺伊州、德克萨斯州、华盛顿州的生物识别法和其他州的隐私法，都要求获得此类同意。在使用发言人搜索功能之前，您必须根据适用法律以及监督您使用该功能的 AWS 服务条款的要求，全面通知并获得一致同意。

下图显示了通过发言人搜索分析任务的数据流示例。图下方的带编号的描述介绍了该过程的每个步骤。该图假设您已经使用具有 VoiceAnalyticsProcessor 的呼叫分析配置来配置了 Amazon Chime SDK 语音连接器。有关更多信息，请参阅录制 Voice Connector 通话。

您或系统管理员创建一个语音配置文件域，用于存储语音嵌入和语音配置文件。有关创建语音配置文件域的更多信息，请参阅 Amazon Chime SDK 管理员指南中的创建语音配置文件域。您也可以使用 CreateVoiceProfileDomainAPI。
呼叫者使用分配给 Amazon Chime SDK 语音连接器的电话号码拨号。或者，座席使用语音连接器号码执行出站呼叫。
Amazon Chime SDK 语音连接器服务会创建一个事务 ID 并将其与呼叫关联。
假设您的应用程序订阅了 EventBridge 事件，则您的应用程序会调用 CreateMediaInsightsPipelineAPI 包含媒体见解管道配置和 Kinesis 视频流， ARNs 用于语音连接器调用。

有关使用的更多信息 EventBridge，请参阅了解 Amazon Chime SDK 基于机器学习的分析工作流程。
您的应用程序（例如交互式语音应答系统）或座席会向呼叫者提供有关呼叫记录和使用语音嵌入进行语音分析的通知，并征得他们的同意才能参与。
一旦来电者表示同意，您的应用程序或代理就可以致电 StartSpeakerSearchTask如果您有语音连接器和交易 ID，则通过语音 SDK 进行 API。或者，如果您使用的是媒体见解渠道 ID 而不是交易 ID，则可以调用 StartSpeakerSearchTask 媒体管道 SDK 中的 API。

一旦呼叫者表示同意，您的应用程序或座席就会调用 StartSpeakerSearchTask API。您必须将语音连接器 ID、事务 ID 和语音配置文件域 ID 传递给 API。返回发言人搜索任务 ID 以识别异步任务。

注意
在其中任何一个中调用 StartSpeakerSearchTask API 之前 SDKs，您必须根据法律和 AW S 服务条款的要求提供所有必要的通知并获得必要的同意。
系统会累积 10 秒钟的呼叫者语音。呼叫者必须至少在这段时间内说话。系统不会捕获或分析静默。
媒体见解管线比较话音与域中的语音配置文件，并列出置信度最高的十个匹配项。如果找不到匹配项，语音连接器就会创建语音配置文件。
媒体见解管线服务向配置的通知目标发送通知事件。
呼叫者继续说话，并额外提供 10 秒钟的非静默话音。
媒体见解管线生成注册语音嵌入，您可用于创建语音配置文件或更新现有语音配置文件。
媒体见解管线向配置的通知目标发送 VoiceprintGenerationSuccessful 通知。
您的应用程序调用 CreateVoiceProfile 或 UpdateVoiceProfile APIs 创建或更新配置文件。
您的应用程序调用 GetSpeakerSearchTask根据需要提供 API，用于获取扬声器搜索任务的最新状态。