Comprendere il flusso di lavoro di ricerca degli altoparlanti per l'SDK Amazon Chime

In questa sezione, ti mostriamo un esempio di flusso di dati e programmi per un'analisi della ricerca di altoparlanti di Amazon Chime SDK.

La funzione di ricerca degli altoparlanti prevede la creazione di un sistema di incorporamento vocale, che può essere utilizzato per confrontare la voce di un chiamante con i dati vocali precedentemente memorizzati. La raccolta, l'uso, l'archiviazione e la conservazione di identificatori biometrici e informazioni biometriche sotto forma di impronta vocale digitale possono richiedere il consenso informato del chiamante tramite un comunicato scritto. Tale consenso è richiesto in base a varie leggi statali, comprese le leggi sulla biometria in Illinois, Texas, Washington e altre leggi statali sulla privacy. Prima di utilizzare la funzione di ricerca dei relatori, devi fornire tutte le notifiche e ottenere tutti i consensi come richiesto dalla legge applicabile e secondo i termini del servizio AWS che regolano l'uso della funzionalità.

Il diagramma seguente mostra un esempio di flusso di dati attraverso un'attività di analisi della ricerca degli oratori. Le descrizioni numerate sotto il diagramma descrivono ogni fase del processo. Il diagramma presuppone che tu abbia già configurato un Amazon Chime SDK Voice Connector con una configurazione di analisi delle chiamate con un. VoiceAnalyticsProcessor Per ulteriori informazioni, consulta Registrazione delle chiamate Voice Connector.

Un diagramma che mostra il flusso di dati attraverso un'analisi della ricerca degli altoparlanti.

L'utente o un amministratore di sistema creano un dominio di profili vocali per l'archiviazione degli incorporamenti vocali e dei profili vocali. Per ulteriori informazioni sulla creazione di domini con profili vocali, consulta Creazione di domini di profili vocali, nella Guida per l'amministratore di Amazon Chime SDK. Puoi anche usare l'API. CreateVoiceProfileDomain
Un chiamante effettua il login utilizzando un numero di telefono assegnato a un Amazon Chime SDK Voice Connector. Oppure, un agente utilizza un numero di Voice Connector per effettuare una chiamata in uscita.
Il servizio Amazon Chime SDK Voice Connector crea un ID di transazione e lo associa alla chiamata.
Supponendo che l'applicazione sia abbonata agli EventBridge eventi, richiama l'CreateMediaInsightsPipelineAPI con la configurazione della pipeline with the media insights e gli ARN Kinesis Video Stream per la chiamata Voice Connector.

Per ulteriori informazioni sull'utilizzo, fare riferimento a. EventBridge Comprensione dei flussi di lavoro per l'analisi basata sull'apprendimento automatico per l'SDK Amazon Chime
L'applicazione, ad esempio un sistema di risposta vocale interattiva, o l'agente informano il chiamante in merito alla registrazione delle chiamate e all'uso degli incorporamenti vocali per l'analisi vocale e richiede il suo consenso a partecipare.
Una volta che il chiamante ha fornito il consenso, l'applicazione o l'agente può chiamare l'StartSpeakerSearchTaskAPI tramite Voice SDK se disponi di un Voice Connector e di un ID di transazione. Oppure, se disponi di un ID pipeline di Media Insights anziché di un ID di transazione, chiami l'StartSpeakerSearchTaskAPI nell'SDK Media pipelines.

Una volta che il chiamante fornisce il consenso, l'applicazione o l'agente chiama l'API. StartSpeakerSearchTask È necessario trasmettere l'ID del connettore vocale, l'ID della transazione e l'ID di dominio del profilo vocale all'API. Viene restituito un ID dell'attività di ricerca degli altoparlanti per identificare l'attività asincrona.

Nota
Prima di richiamare l'StartSpeakerSearchTaskAPI in uno degli SDK, devi fornire tutte le notifiche necessarie e ottenere i consensi necessari, come richiesto dalla legge e dai termini del servizio AWS.
Il sistema accumula 10 secondi di voce del chiamante. Il chiamante deve parlare almeno per quel periodo di tempo. Il sistema non cattura o analizza il silenzio.
La pipeline Media Insights confronta il discorso con i profili vocali del dominio ed elenca i 10 risultati più attendibili. Se non trova una corrispondenza, Voice Connector crea un profilo vocale.
Il servizio Media Insights Pipeline invia un evento di notifica agli obiettivi di notifica configurati.
Il chiamante continua a parlare e fornisce altri 10 secondi di conversazione senza silenzio.
La pipeline Media Insights genera un sistema di incorporamento vocale di registrazione che puoi utilizzare per creare un profilo vocale o aggiornare un profilo vocale esistente.
La pipeline di media insights invia una VoiceprintGenerationSuccessful notifica agli obiettivi di notifica configurati.
L'applicazione chiama le CreateVoiceProfileo UpdateVoiceProfileAPI per creare o aggiornare il profilo.
L'applicazione richiama l'GetSpeakerSearchTaskAPI secondo necessità per ottenere lo stato più recente dell'attività di ricerca dei relatori.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Comprendere l'architettura di analisi vocale

Esempio di flusso di lavoro di analisi del tono vocale

Comprendere il flusso di lavoro di ricerca degli altoparlanti per l'SDK Amazon Chime

Nota