Comprendre le flux de recherche de haut-parleurs pour le SDK Amazon Chime

Dans cette section, nous vous présentons un exemple de flux de données et de programmes pour une analyse de recherche de haut-parleurs dans le SDK Amazon Chime.

La fonction de recherche de locuteurs implique la création d'une intégration vocale, qui peut être utilisée pour comparer la voix d'un appelant aux données vocales précédemment stockées. La collecte, l'utilisation, le stockage et la conservation d'identifiants biométriques et d'informations biométriques sous forme d'empreinte vocale numérique peuvent nécessiter le consentement éclairé de l'appelant sous forme d'une autorisation écrite. Ce consentement est requis en vertu de diverses lois d'État, notamment les lois biométriques de l'Illinois, du Texas, de Washington et d'autres lois sur la protection de la vie privée. Avant d'utiliser la fonction de recherche de conférenciers, vous devez fournir toutes les notifications et obtenir tous les consentements conformément à la loi applicable et aux conditions de service AWS régissant votre utilisation de cette fonctionnalité.

Le schéma suivant montre un exemple de flux de données via une tâche d'analyse de recherche de locuteurs. Les descriptions numérotées situées sous le schéma décrivent chaque étape du processus. Le schéma suppose que vous avez déjà configuré un connecteur vocal du SDK Amazon Chime avec une configuration d'analyse des appels dotée d'un. VoiceAnalyticsProcessor Pour de plus amples informations, veuillez consulter Enregistrement des appels via le connecteur vocal.

Schéma illustrant le flux de données lors d'une analyse de recherche de locuteurs.

Vous ou un administrateur système créez un domaine de profil vocal pour stocker les intégrations vocales et les profils vocaux. Pour plus d'informations sur la création de domaines de profils vocaux, consultez la section Création de domaines de profils vocaux dans le guide de l'administrateur du SDK Amazon Chime. Vous pouvez également utiliser l'CreateVoiceProfileDomainAPI.
Un appelant se connecte en utilisant un numéro de téléphone attribué à un connecteur vocal Amazon Chime SDK. Ou bien, un agent utilise un numéro de connecteur vocal pour passer un appel sortant.
Le service Amazon Chime SDK Voice Connector crée un identifiant de transaction et l'associe à l'appel.
En supposant que votre application soit abonnée aux EventBridge événements, elle appelle l'CreateMediaInsightsPipelineAPI avec la configuration du pipeline Media Insights et les ARN Kinesis Video Stream pour l'appel Voice Connector.

Pour plus d'informations sur l'utilisation EventBridge, reportez-vous àComprendre les flux de travail pour les analyses basées sur l'apprentissage automatique pour le SDK Amazon Chime.
Votre application, comme un système de réponse vocale interactive, ou votre agent informe l'appelant concernant l'enregistrement des appels et l'utilisation d'intégrations vocales à des fins d'analyse vocale et sollicite son consentement pour participer.
Une fois que l'appelant a donné son consentement, votre application ou votre agent peut appeler l'StartSpeakerSearchTaskAPI via le SDK vocal si vous disposez d'un connecteur vocal et d'un identifiant de transaction. Ou, si vous avez un ID de pipeline Media Insights au lieu d'un ID de transaction, vous appelez l'StartSpeakerSearchTaskAPI dans le SDK Media Pipelines.

Une fois que l'appelant a donné son consentement, votre application ou votre agent appelle l'StartSpeakerSearchTaskAPI. Vous devez transmettre l'identifiant du connecteur vocal, l'identifiant de transaction et l'identifiant de domaine du profil vocal à l'API. Un identifiant de tâche de recherche de haut-parleurs est renvoyé pour identifier la tâche asynchrone.

Note
Avant d'invoquer l'StartSpeakerSearchTaskAPI dans l'un des SDK, vous devez fournir les notifications nécessaires et obtenir les consentements nécessaires, conformément à la loi et aux conditions de service AWS.
Le système accumule 10 secondes de la voix de l'appelant. L'appelant doit parler pendant au moins ce laps de temps. Le système ne capture ni n'analyse le silence.
Le pipeline d'informations sur les médias compare le discours aux profils vocaux du domaine et répertorie les 10 meilleures correspondances fiables. S'il ne trouve aucune correspondance, le connecteur vocal crée un profil vocal.
Le service Media Insights Pipeline envoie un événement de notification aux cibles de notification configurées.
L'appelant continue à parler et prononce un discours sans silence pendant 10 secondes supplémentaires.
Le pipeline d'informations sur les médias génère une intégration vocale d'inscription que vous pouvez utiliser pour créer un profil vocal ou mettre à jour un profil vocal existant.
Le pipeline Media Insights envoie une VoiceprintGenerationSuccessful notification aux cibles de notification configurées.
Votre application appelle les UpdateVoiceProfileAPI CreateVoiceProfileor pour créer ou mettre à jour le profil.
Votre application appelle l'GetSpeakerSearchTaskAPI selon les besoins pour obtenir le dernier statut de la tâche de recherche de haut-parleurs.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Comprendre l'architecture d'analyse vocale

Exemple de flux de travail d'analyse du ton vocal

Comprendre le flux de recherche de haut-parleurs pour le SDK Amazon Chime

Note