Sintassi della richiesta Parametri della richiesta URI:Corpo della richiesta Sintassi della risposta Elementi di risposta Errori Vedi anche

StartCallAnalyticsStreamTranscription

Avvia uno streaming bidirezionale HTTP/2 in cui l'audio viene trasmesso in WebSocket streaming ad Amazon Transcribe e i risultati della trascrizione vengono trasmessi all'applicazione. Usa questa operazione per le trascrizioni di Call Analytics.

I parametri seguenti sono obbligatori:

language-code
media-encoding
sample-rate

Per ulteriori informazioni sullo streaming con Amazon Transcribe, consulta Trascrizione dell'audio in streaming.

Sintassi della richiesta


POST /call-analytics-stream-transcription HTTP/2
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName
x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod
x-amzn-transcribe-language-model-name: LanguageModelName
x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization
x-amzn-transcribe-partial-results-stability: PartialResultsStability
x-amzn-transcribe-content-identification-type: ContentIdentificationType
x-amzn-transcribe-content-redaction-type: ContentRedactionType
x-amzn-transcribe-pii-entity-types: PiiEntityTypes
Content-type: application/json

{
   "AudioStream": { 
      "AudioEvent": { 
         "AudioChunk": blob
      },
      "ConfigurationEvent": { 
         "ChannelDefinitions": [ 
            { 
               "ChannelId": number,
               "ParticipantRole": "string"
            }
         ],
         "PostCallAnalyticsSettings": { 
            "ContentRedactionOutput": "string",
            "DataAccessRoleArn": "string",
            "OutputEncryptionKMSKeyId": "string",
            "OutputLocation": "string"
         }
      }
   }
}

Parametri della richiesta URI:

La richiesta utilizza i seguenti parametri URI.

ContentIdentificationType

Indica tutte le informazioni personali di identificazione (PII) identificate nella trascrizione.

L'identificazione del contenuto viene eseguita a livello di segmento; le informazioni PII specificate inPiiEntityTypes vengono contrassegnate al momento della trascrizione completa di un segmento audio.

Non puoi impostareContentIdentificationType eContentRedactionType nella stessa richiesta. Se li imposti entrambi, la tua richiesta restituisce unBadRequestException.

Per ulteriori informazioni, vedere Revisione o identificazione delle informazioni di identificazione personale.

Valori validi: PII

ContentRedactionType

Cancella tutte le informazioni personali di identificazione (PII) di identificazione (PII) identificate nella trascrizione.

La redazione dei contenuti viene eseguita a livello di segmento; le informazioni PII specificate inPiiEntityTypes vengono redatte dopo la trascrizione completa di un segmento audio.

Non puoi impostareContentRedactionType eContentIdentificationType nella stessa richiesta. Se li imposti entrambi, la tua richiesta restituisce unBadRequestException.

Per ulteriori informazioni, vedere Revisione o identificazione delle informazioni di identificazione personale.

Valori validi: PII

EnablePartialResultsStabilization

Consente la stabilizzazione parziale dei risultati per la trascrizione. La stabilizzazione parziale dei risultati può ridurre la latenza dell'output, ma può influire sulla precisione. Per ulteriori informazioni, consulta Stabilizzazione parziale dei risultati.

LanguageCode

Specifica il codice della lingua che rappresenta la lingua parlata nell'audio.

Se non sei sicuro della lingua parlata nel tuo audio, prendi in considerazione l'utilizzoIdentifyLanguage per abilitare l'identificazione automatica della lingua.

Per un elenco delle lingue supportate da Call Analytics in tempo reale, consulta la tabella Lingue supportate.

Campo obbligatorio: sì

LanguageModelName

Specifica il nome del modello linguistico personalizzato che desideri utilizzare durante l'elaborazione della trascrizione. Nota che i nomi dei modelli linguistici fanno distinzione tra maiuscole e minuscole

La lingua del modello linguistico specificato deve corrispondere al codice linguistico specificato nella richiesta di trascrizione. Se le lingue non corrispondono, il modello linguistico personalizzato non viene applicato. Non ci sono errori o avvisi associati a una mancata corrispondenza linguistica.

Per ulteriori informazioni, consulta Modelli linguistici personalizzati.

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

MediaEncoding

Specifica la codifica dell'audio in ingresso. I formati supportati sono:

FLAC
Audio codificato OPUS in un contenitore Ogg
PCM (solo formati audio little-endian firmati a 16 bit, che non includono WAV)

Per ulteriori informazioni, consulta Formati multimediali.

Valori validi: pcm | ogg-opus | flac

Campo obbligatorio: sì

MediaSampleRateHertz

Frequenza di campionamento dell'audio in ingresso (in hertz). L'audio di bassa qualità, come l'audio del telefono, è in genere di circa 8.000 Hz. L'audio di alta qualità varia in genere da 16.000 Hz a 48.000 Hz. Tieni presente che la frequenza di campionamento specificata deve corrispondere a quella dell'audio.

Intervallo valido: valore minimo di 8000. Valmassimo massimo massimo massimo massimo massimo massimo massimo massimo massimo massimo massimo

Campo obbligatorio: sì

PartialResultsStability

Specifica il livello di stabilità da utilizzare quando si abilita la stabilizzazione parziale dei risultati (EnablePartialResultsStabilization).

La bassa stabilità offre la massima precisione. L'elevata stabilità trascrive più velocemente, ma con una precisione leggermente inferiore.

Per ulteriori informazioni, consulta Stabilizzazione parziale dei risultati.

Valori validi: high | medium | low

PiiEntityTypes

Specifica quali tipi di informazioni di identificazione personale (PII) desideri cancellare nella tua trascrizione. Puoi includere tutti i tipi che desideri oppure puoi selezionarliALL.

Per includerePiiEntityTypes nella tua richiesta di Call Analytics, devi includere anche unoContentIdentificationType oContentRedactionType.

I valori devono essere separati da virgole e possono includere:ADDRESSBANK_ACCOUNT_NUMBERBANK_ROUTING,CREDIT_DEBIT_CVV,CREDIT_DEBIT_EXPIRY,CREDIT_DEBIT_NUMBER,EMAIL,NAME,PHONE,PIN,SSN, oALL.

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 300.

Pattern: ^[A-Z_, ]+

SessionId

Specifica un nome per la tua sessione di trascrizione di Call Analytics. Se non includi questo parametro nella tua richiesta, Amazon Transcribe genera un ID e lo restituisce nella risposta.

Limitazioni di lunghezza: lunghezza fissa di 36.

Pattern: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

VocabularyFilterMethod

Specifica come vuoi che il filtro del vocabolario venga applicato alla tua trascrizione.

Per sostituire le parole con***, sceglimask.

Per eliminare le parole, scegliremove.

Per contrassegnare le parole senza modificarle, sceglitag.

Valori validi: remove | mask | tag

VocabularyFilterName

Specifica il nome del filtro di vocabolario personalizzato che desideri utilizzare durante l'elaborazione della trascrizione. Nota che i nomi dei filtri del vocabolario fanno distinzione tra lettere maiuscole e minuscole.

Se la lingua del filtro di vocabolario personalizzato specificato non corrisponde alla lingua identificata nei file multimediali, il filtro del vocabolario non viene applicato alla trascrizione.

Per ulteriori informazioni, consulta Usare il filtro del vocabolario con parole indesiderate.

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

VocabularyName

Specifica il nome del vocabolario personalizzato che desideri utilizzare durante l'elaborazione della trascrizione. Nota che i nomi dei vocaboli fanno distinzione tra lettere maiuscole e minuscole.

Se la lingua del vocabolario personalizzato specificato non corrisponde alla lingua identificata nei tuoi media, il vocabolario personalizzato non viene applicato alla trascrizione.

Per ulteriori informazioni, consulta Vocabolari personalizzati.

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

Corpo della richiesta

La richiesta accetta i seguenti dati in formato JSON.

AudioStream

Un flusso codificato di blob audio. I flussi audio sono codificati come HTTP/2 o frame di WebSocket dati.

Per ulteriori informazioni, consulta Trascrizione dell'audio in streaming.

Tipo: CallAnalyticsAudioStream oggetto

Campo obbligatorio: sì

Sintassi della risposta


HTTP/2 200
x-amzn-request-id: RequestId
x-amzn-transcribe-language-code: LanguageCode
x-amzn-transcribe-sample-rate: MediaSampleRateHertz
x-amzn-transcribe-media-encoding: MediaEncoding
x-amzn-transcribe-vocabulary-name: VocabularyName
x-amzn-transcribe-session-id: SessionId
x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName
x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod
x-amzn-transcribe-language-model-name: LanguageModelName
x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization
x-amzn-transcribe-partial-results-stability: PartialResultsStability
x-amzn-transcribe-content-identification-type: ContentIdentificationType
x-amzn-transcribe-content-redaction-type: ContentRedactionType
x-amzn-transcribe-pii-entity-types: PiiEntityTypes
Content-type: application/json

{
   "CallAnalyticsTranscriptResultStream": { 
      "BadRequestException": { 
      },
      "CategoryEvent": { 
         "MatchedCategories": [ "string" ],
         "MatchedDetails": { 
            "string" : { 
               "TimestampRanges": [ 
                  { 
                     "BeginOffsetMillis": number,
                     "EndOffsetMillis": number
                  }
               ]
            }
         }
      },
      "ConflictException": { 
      },
      "InternalFailureException": { 
      },
      "LimitExceededException": { 
      },
      "ServiceUnavailableException": { 
      },
      "UtteranceEvent": { 
         "BeginOffsetMillis": number,
         "EndOffsetMillis": number,
         "Entities": [ 
            { 
               "BeginOffsetMillis": number,
               "Category": "string",
               "Confidence": number,
               "Content": "string",
               "EndOffsetMillis": number,
               "Type": "string"
            }
         ],
         "IsPartial": boolean,
         "IssuesDetected": [ 
            { 
               "CharacterOffsets": { 
                  "Begin": number,
                  "End": number
               }
            }
         ],
         "Items": [ 
            { 
               "BeginOffsetMillis": number,
               "Confidence": number,
               "Content": "string",
               "EndOffsetMillis": number,
               "Stable": boolean,
               "Type": "string",
               "VocabularyFilterMatch": boolean
            }
         ],
         "ParticipantRole": "string",
         "Sentiment": "string",
         "Transcript": "string",
         "UtteranceId": "string"
      }
   }
}

Elementi di risposta

Se l'operazione riesce, il servizio restituisce una risposta HTTP 200.

La risposta restituisce le seguenti intestazioni HTTP.

ContentIdentificationType

Mostra se l'identificazione dei contenuti è stata abilitata per la trascrizione di Call Analytics.

Valori validi: PII

ContentRedactionType

Mostra se la redazione dei contenuti è stata abilitata per la trascrizione di Call Analytics.

Valori validi: PII

EnablePartialResultsStabilization

Mostra se la stabilizzazione parziale dei risultati è stata abilitata per la trascrizione di Call Analytics.

LanguageCode

Fornisce il codice della lingua specificato nella richiesta di Call Analytics.

LanguageModelName

Fornisce il nome del modello linguistico personalizzato specificato nella richiesta di Call Analytics.

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

MediaEncoding

Fornisce la codifica multimediale specificata nella richiesta di analisi delle chiamate.

Valori validi: pcm | ogg-opus | flac

MediaSampleRateHertz

Fornisce la frequenza di campionamento specificata nella richiesta di analisi delle chiamate.

Intervallo valido: valore minimo di 8000. Valmassimo massimo massimo massimo massimo massimo massimo massimo massimo massimo massimo massimo

PartialResultsStability

Fornisce il livello di stabilizzazione utilizzato per la trascrizione.

Valori validi: high | medium | low

PiiEntityTypes

Elenca i tipi di entità PII che hai specificato nella tua richiesta di Call Analytics.

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 300.

Pattern: ^[A-Z_, ]+

RequestId

Fornisce l'identificatore per la tua richiesta di analisi delle chiamate in tempo reale.

SessionId

Fornisce l'identificatore per la sessione di trascrizione di Call Analytics.

Limitazioni di lunghezza: lunghezza fissa di 36.

Pattern: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

VocabularyFilterMethod

Fornisce il metodo di filtraggio del vocabolario utilizzato nella trascrizione di Call Analytics.

Valori validi: remove | mask | tag

VocabularyFilterName

Fornisce il nome del filtro di vocabolario personalizzato specificato nella richiesta di Call Analytics.

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

VocabularyName

Fornisce il nome del vocabolario personalizzato specificato nella richiesta di Call Analytics.

Limitazioni di lunghezza: lunghezza minima di 1. Lunghezza massima di 200.

Pattern: ^[0-9a-zA-Z._-]+

I dati seguenti vengono restituiti in formato JSON mediante il servizio.

CallAnalyticsTranscriptResultStream

Fornisce informazioni dettagliate sulla sessione di Call Analytics in tempo reale.

Tipo: CallAnalyticsTranscriptResultStream oggetto

Errori

Per informazioni sugli errori comuni a tutte le operazioni, consultare Errori comuni.

BadRequestException

Uno o più argomenti dell'StartCallAnalyticsStreamTranscriptionoperazioneStartStreamTranscriptionStartMedicalStreamTranscription, or non erano validi. Ad esempio,MediaEncoding o haLanguageCode utilizzato valori non supportati. Controlla i parametri specificati e riprova la richiesta.

Codice di stato HTTP: 400

ConflictException

È iniziato un nuovo stream con lo stesso ID di sessione. Lo stream corrente è stato interrotto.

Codice di stato HTTP: 409

InternalFailureException

Si è verificato un problema durante l'elaborazione dell'audio. Amazon Transcribe ha terminato l'elaborazione.

Codice di stato HTTP: 500

LimitExceededException

Il tuo cliente ha superato uno dei limiti di Amazon Transcribe. Questo è in genere il limite di lunghezza dell'audio. Suddividi il flusso audio in blocchi più piccoli e riprova la richiesta.

Codice di stato HTTP: 429

ServiceUnavailableException

Il servizio al momento non è disponibile. Prova la tua richiesta più tardi.

Codice di stato HTTP: 503

Vedi anche

Per ulteriori informazioni sull'utilizzo di questa API in uno degli SDK AWS specifici della lingua, consulta quanto segue:

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Servizio di streaming Amazon Transcribe

StartMedicalStreamTranscription