Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Dans cette section, nous vous présentons un exemple de flux de données et de programmes pour une analyse de recherche de haut-parleurs dans le SDK Amazon Chime.
La fonction de recherche de locuteurs implique la création d'une intégration vocale, qui peut être utilisée pour comparer la voix d'un appelant aux données vocales précédemment stockées. La collecte, l'utilisation, le stockage et la conservation d'identifiants biométriques et d'informations biométriques sous forme d'empreinte vocale numérique peuvent nécessiter le consentement éclairé de l'appelant sous forme d'une autorisation écrite. Ce consentement est requis en vertu de diverses lois d'État, notamment les lois biométriques de l'Illinois, du Texas, de Washington et d'autres lois sur la protection de la vie privée. Avant d'utiliser la fonction de recherche de conférenciers, vous devez fournir toutes les notifications et obtenir tous les consentements conformément à la loi applicable et aux conditions de service AWS
Le schéma suivant montre un exemple de flux de données via une tâche d'analyse de recherche de locuteurs. Les descriptions numérotées situées sous le schéma décrivent chaque étape du processus. Le schéma suppose que vous avez déjà configuré un connecteur vocal du SDK Amazon Chime avec une configuration d'analyse des appels dotée d'un. VoiceAnalyticsProcessor
Pour de plus amples informations, veuillez consulter Enregistrement des appels via le connecteur vocal.

-
Vous ou un administrateur système créez un domaine de profil vocal pour stocker les intégrations vocales et les profils vocaux. Pour plus d'informations sur la création de domaines de profils vocaux, consultez la section Création de domaines de profils vocaux dans le guide de l'administrateur du SDK Amazon Chime. Vous pouvez également utiliser le CreateVoiceProfileDomainAPI.
-
Un appelant se connecte en utilisant un numéro de téléphone attribué à un connecteur vocal Amazon Chime SDK. Ou bien, un agent utilise un numéro de connecteur vocal pour passer un appel sortant.
-
Le service Amazon Chime SDK Voice Connector crée un identifiant de transaction et l'associe à l'appel.
-
En supposant que votre application soit abonnée à EventBridge des événements, elle appelle le CreateMediaInsightsPipelineAPI avec configuration du pipeline Media Insights et Kinesis Video Stream ARNs pour l'appel Voice Connector.
Pour plus d'informations sur l'utilisation EventBridge, reportez-vous àComprendre les flux de travail pour les analyses basées sur l'apprentissage automatique pour le SDK Amazon Chime.
-
Votre application, comme un système de réponse vocale interactive, ou votre agent informe l'appelant concernant l'enregistrement des appels et l'utilisation d'intégrations vocales à des fins d'analyse vocale et sollicite son consentement pour participer.
-
Une fois que l'appelant a donné son consentement, votre application ou votre agent peut appeler le StartSpeakerSearchTaskAPI via le SDK vocal si vous disposez d'un connecteur vocal et d'un identifiant de transaction. Ou, si vous avez un identifiant de pipeline Media Insights au lieu d'un identifiant de transaction, vous appelez le StartSpeakerSearchTaskAPI dans le SDK Media Pipelines.
Une fois que l'appelant a donné son consentement, votre application ou votre agent appelle l'
StartSpeakerSearchTask
API. Vous devez transmettre l'identifiant du connecteur vocal, l'identifiant de transaction et l'identifiant de domaine du profil vocal à l'API. Un identifiant de tâche de recherche de haut-parleurs est renvoyé pour identifier la tâche asynchrone.Note
Avant d'invoquer l'
StartSpeakerSearchTask
API dans l'un ou l'autre des SDKs, vous devez fournir les notifications nécessaires et obtenir les consentements nécessaires, conformément à la loi et aux conditions de service AWS. -
Le système accumule 10 secondes de la voix de l'appelant. L'appelant doit parler pendant au moins ce laps de temps. Le système ne capture ni n'analyse le silence.
-
Le pipeline d'informations sur les médias compare le discours aux profils vocaux du domaine et répertorie les 10 meilleures correspondances avec un niveau de confiance élevé. S'il ne trouve aucune correspondance, le connecteur vocal crée un profil vocal.
-
Le service Media Insights Pipeline envoie un événement de notification aux cibles de notification configurées.
-
L'appelant continue à parler et prononce un discours sans silence pendant 10 secondes supplémentaires.
-
Le pipeline d'informations sur les médias génère une intégration vocale d'inscription que vous pouvez utiliser pour créer un profil vocal ou mettre à jour un profil vocal existant.
-
Le pipeline Media Insights envoie une
VoiceprintGenerationSuccessful
notification aux cibles de notification configurées. -
Votre application appelle le CreateVoiceProfile ou UpdateVoiceProfile APIs pour créer ou mettre à jour le profil.
-
Votre application appelle le GetSpeakerSearchTaskAPI selon les besoins pour obtenir le dernier statut de la tâche de recherche de haut-parleurs.