Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Comprendere il flusso di lavoro di ricerca degli altoparlanti per l'SDK Amazon Chime

Modalità Focus
Comprendere il flusso di lavoro di ricerca degli altoparlanti per l'SDK Amazon Chime - SDK Amazon Chime

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

In questa sezione, ti mostriamo un esempio di flusso di dati e programmi per un'analisi della ricerca di altoparlanti di Amazon Chime SDK.

La funzione di ricerca degli altoparlanti prevede la creazione di un sistema di incorporamento vocale, che può essere utilizzato per confrontare la voce di un chiamante con i dati vocali precedentemente memorizzati. La raccolta, l'uso, l'archiviazione e la conservazione di identificatori biometrici e informazioni biometriche sotto forma di impronta vocale digitale possono richiedere il consenso informato del chiamante tramite un comunicato scritto. Tale consenso è richiesto in base a varie leggi statali, comprese le leggi sulla biometria in Illinois, Texas, Washington e altre leggi statali sulla privacy. Prima di utilizzare la funzione di ricerca dei relatori, devi fornire tutte le notifiche e ottenere tutti i consensi come richiesto dalla legge applicabile e secondo i termini del servizio AWS che regolano l'uso della funzionalità.

Il diagramma seguente mostra un esempio di flusso di dati attraverso un'attività di analisi della ricerca degli oratori. Le descrizioni numerate sotto il diagramma descrivono ogni fase del processo. Il diagramma presuppone che tu abbia già configurato un Amazon Chime SDK Voice Connector con una configurazione di analisi delle chiamate con un. VoiceAnalyticsProcessor Per ulteriori informazioni, consulta Registrazione delle chiamate Voice Connector.

Un diagramma che mostra il flusso di dati attraverso un'analisi della ricerca degli altoparlanti.
  1. L'utente o un amministratore di sistema creano un dominio di profili vocali per l'archiviazione degli incorporamenti vocali e dei profili vocali. Per ulteriori informazioni sulla creazione di domini con profili vocali, consulta Creazione di domini di profili vocali, nella Guida per l'amministratore di Amazon Chime SDK. Puoi anche usare il CreateVoiceProfileDomainAPI.

  2. Un chiamante effettua il login utilizzando un numero di telefono assegnato a un Amazon Chime SDK Voice Connector. Oppure, un agente utilizza un numero di Voice Connector per effettuare una chiamata in uscita.

  3. Il servizio Amazon Chime SDK Voice Connector crea un ID di transazione e lo associa alla chiamata.

  4. Supponendo che l'applicazione si iscriva agli EventBridge eventi, l'applicazione chiama CreateMediaInsightsPipelineAPI con la configurazione della pipeline with the media insights e Kinesis Video ARNs Stream per la chiamata Voice Connector.

    Per ulteriori informazioni sull'utilizzo EventBridge, consulta. Comprensione dei flussi di lavoro per l'analisi basata sull'apprendimento automatico per l'SDK Amazon Chime

  5. L'applicazione, ad esempio un sistema di risposta vocale interattiva, o l'agente informano il chiamante in merito alla registrazione delle chiamate e all'uso degli incorporamenti vocali per l'analisi vocale e richiede il suo consenso a partecipare.

  6. Una volta che il chiamante ha fornito il consenso, l'applicazione o l'agente può chiamare il StartSpeakerSearchTaskAPI tramite Voice SDK se disponi di un Voice Connector e di un ID di transazione. Oppure, se disponi di un ID di pipeline di Media Insights anziché di un ID di transazione, chiami StartSpeakerSearchTaskAPI nell'SDK Media Pipelines.

    Una volta che il chiamante fornisce il consenso, l'applicazione o l'agente chiama l'API. StartSpeakerSearchTask È necessario trasmettere l'ID del connettore vocale, l'ID della transazione e l'ID di dominio del profilo vocale all'API. Viene restituito un ID dell'attività di ricerca degli altoparlanti per identificare l'attività asincrona.

    Nota

    Prima di richiamare l'StartSpeakerSearchTaskAPI in uno dei due SDKs, devi fornire tutte le notifiche necessarie e ottenere i consensi necessari, come richiesto dalla legge e dai termini del servizio AWS.

  7. Il sistema accumula 10 secondi di voce del chiamante. Il chiamante deve parlare almeno per quel periodo di tempo. Il sistema non cattura o analizza il silenzio.

  8. La pipeline Media Insights confronta il discorso con i profili vocali del dominio ed elenca i 10 risultati più attendibili. Se non trova una corrispondenza, Voice Connector crea un profilo vocale.

  9. Il servizio Media Insights Pipeline invia un evento di notifica agli obiettivi di notifica configurati.

  10. Il chiamante continua a parlare e fornisce altri 10 secondi di conversazione senza silenzio.

  11. La pipeline Media Insights genera un sistema di incorporamento vocale di registrazione che puoi utilizzare per creare un profilo vocale o aggiornare un profilo vocale esistente.

  12. La pipeline di media insights invia una VoiceprintGenerationSuccessful notifica agli obiettivi di notifica configurati.

  13. L'applicazione chiama il CreateVoiceProfile o UpdateVoiceProfile APIs per creare o aggiornare il profilo.

  14. L'applicazione chiama il GetSpeakerSearchTaskAPI necessaria per ottenere lo stato più recente dell'attività di ricerca degli oratori.

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.