StartCallAnalyticsStreamTranscription - Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

StartCallAnalyticsStreamTranscription

Inicia um HTTP/2 ou WebSocket stream bidirecional em que o áudio é transmitido para o Amazon Transcribe e os resultados da transcrição são transmitidos para o aplicativo. Use essa operação para transcrições do Call Analytics.

Os seguintes parâmetros são obrigatórios:

  • language-code

  • media-encoding

  • sample-rate

Para obter mais informações sobre streaming com o Amazon Transcribe, consulte Transcrição de streaming de áudio.

Sintaxe da solicitação

POST /call-analytics-stream-transcription HTTP/2 x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod x-amzn-transcribe-language-model-name: LanguageModelName x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization x-amzn-transcribe-partial-results-stability: PartialResultsStability x-amzn-transcribe-content-identification-type: ContentIdentificationType x-amzn-transcribe-content-redaction-type: ContentRedactionType x-amzn-transcribe-pii-entity-types: PiiEntityTypes Content-type: application/json { "AudioStream": { "AudioEvent": { "AudioChunk": blob }, "ConfigurationEvent": { "ChannelDefinitions": [ { "ChannelId": number, "ParticipantRole": "string" } ], "PostCallAnalyticsSettings": { "ContentRedactionOutput": "string", "DataAccessRoleArn": "string", "OutputEncryptionKMSKeyId": "string", "OutputLocation": "string" } } } }

Parâmetros da solicitação de URI

A solicitação usa os parâmetros de URI a seguir.

ContentIdentificationType

Rotula todas as informações de identificação pessoal (PII) identificadas em sua transcrição.

A identificação do conteúdo é realizada no nível do segmento; as PII especificadas emPiiEntityTypes são sinalizadas após a transcrição completa de um segmento de áudio.

Você não pode definirContentIdentificationType eContentRedactionType na mesma solicitação. Se você definir ambos, sua solicitação retornará umBadRequestException.

Para obter mais informações, consulte Editando ou identificando informações de identificação pessoal.

Valores válidos: PII

ContentRedactionType

Redigi todas as informações de identificação pessoal (PII) identificadas em sua transcrição.

A redação do conteúdo é realizada no nível do segmento; as PII especificadas emPiiEntityTypes são editadas após a transcrição completa de um segmento de áudio.

Você não pode definirContentRedactionType eContentIdentificationType na mesma solicitação. Se você definir ambos, sua solicitação retornará umBadRequestException.

Para obter mais informações, consulte Editando ou identificando informações de identificação pessoal.

Valores válidos: PII

EnablePartialResultsStabilization

Permite a estabilização parcial do resultado para sua transcrição. A estabilização parcial dos resultados pode reduzir a latência na saída, mas pode afetar a precisão. Para obter mais informações, consulte Estabilização parcial de resultados.

LanguageCode

Especifique o código do idioma que representa o idioma falado em seu áudio.

Se você não tiver certeza do idioma falado no áudio, considere usarIdentifyLanguage para habilitar a identificação automática do idioma.

Para obter uma lista de idiomas compatíveis com o Call Analytics em tempo real, consulte a tabela de idiomas suportados.

Valores válidos: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR

Obrigatório: Sim

LanguageModelName

Especifique o nome do modelo de idioma personalizado que você deseja usar ao processar sua transcrição. Observe que os nomes de modelo de linguagem diferenciam letras maiúsculas de minúsculas.

O idioma do modelo de idioma especificado deve corresponder ao código do idioma especificado na solicitação de transcrição. Se os idiomas não corresponderem, o modelo de idioma personalizado não será aplicado. Não há erros ou avisos associados a uma incompatibilidade de idioma.

Para obter mais informações, consulte Modelos de linguagem personalizados.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

MediaEncoding

Especifique a codificação do áudio de entrada. Os formatos com suporte são:

  • FLAC

  • Áudio codificado em Opus em um contêiner Ogg

  • PCM (somente formatos de áudio little-endian de 16 bits assinados, que não incluem WAV)

Para obter mais informações, consulte Formatos de mídia.

Valores válidos: pcm | ogg-opus | flac

Obrigatório: Sim

MediaSampleRateHertz

A taxa de amostragem do áudio de entrada (em hertz). O áudio de baixa qualidade, como o áudio do telefone, normalmente está em torno de 8.000 Hz. O áudio de alta qualidade normalmente varia de 16.000 Hz a 48.000 Hz. Observe que a taxa de amostragem especificada deve corresponder à do seu áudio.

Intervalo válido: valor mínimo de 8000. Valor máximo de 48000.

Obrigatório: Sim

PartialResultsStability

Especifique o nível de estabilidade a ser usado ao ativar a estabilização parcial dos resultados (EnablePartialResultsStabilization).

A baixa estabilidade fornece a maior precisão. A alta estabilidade transcreve mais rapidamente, mas com uma precisão um pouco menor.

Para obter mais informações, consulte Estabilização parcial de resultados.

Valores válidos: high | medium | low

PiiEntityTypes

Especifique quais tipos de informações de identificação pessoal (PII) você deseja redigir em sua transcrição. Você pode incluir quantos tipos quiser ou selecionarALL.

Para incluirPiiEntityTypes em sua solicitação de análise de chamadas, você também deve incluir umContentIdentificationType ouContentRedactionType.

Os valores devem ser separados por vírgula e podem incluir:ADDRESSBANK_ACCOUNT_NUMBERBANK_ROUTINGCREDIT_DEBIT_CVVCREDIT_DEBIT_EXPIRY,CREDIT_DEBIT_NUMBER,EMAIL,NAME,PHONE,PIN,SSN, ouALL.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 300.

Padrão: ^[A-Z_, ]+

SessionId

Especifique um nome para sua sessão de transcrição do Call Analytics. Se você não incluir esse parâmetro em sua solicitação, o Amazon Transcribe gerará uma ID e a retornará na resposta.

Restrições de comprimento: comprimento fixo de 36.

Padrão: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

VocabularyFilterMethod

Especifique como você deseja que seu filtro de vocabulário seja aplicado à sua transcrição.

Para substituir palavras por***, escolhamask.

Para excluir palavras, escolharemove.

Para sinalizar palavras sem alterá-las, escolhatag.

Valores válidos: remove | mask | tag

VocabularyFilterName

Especifique o nome do filtro de vocabulário personalizado que você deseja usar ao processar sua transcrição. Observe que os nomes do filtro de vocabulário diferenciam letras maiúsculas de minúsculas.

Se o idioma do filtro de vocabulário personalizado especificado não corresponder ao idioma identificado em sua mídia, o filtro de vocabulário não será aplicado à sua transcrição.

Para obter mais informações, consulte Uso da filtragem de vocabulário com palavras indesejadas.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

VocabularyName

Especifique o nome do vocabulário personalizado que você deseja usar ao processar sua transcrição. Observe que os nomes do vocabulário diferenciam letras maiúsculas de minúsculas.

Se o idioma do vocabulário personalizado especificado não corresponder ao idioma identificado em sua mídia, o vocabulário personalizado não será aplicado à sua transcrição.

Para obter mais informações, consulte Vocabulários personalizados.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

Corpo da solicitação

A solicitação aceita os dados a seguir no formato JSON.

AudioStream

Um fluxo codificado de bolhas de áudio. Os fluxos de áudio são codificados como HTTP/2 ou quadros WebSocket de dados.

Para obter mais informações, consulte Transcrição de streaming de áudio.

Tipo: objeto CallAnalyticsAudioStream

Obrigatório: Sim

Sintaxe da resposta

HTTP/2 200 x-amzn-request-id: RequestId x-amzn-transcribe-language-code: LanguageCode x-amzn-transcribe-sample-rate: MediaSampleRateHertz x-amzn-transcribe-media-encoding: MediaEncoding x-amzn-transcribe-vocabulary-name: VocabularyName x-amzn-transcribe-session-id: SessionId x-amzn-transcribe-vocabulary-filter-name: VocabularyFilterName x-amzn-transcribe-vocabulary-filter-method: VocabularyFilterMethod x-amzn-transcribe-language-model-name: LanguageModelName x-amzn-transcribe-enable-partial-results-stabilization: EnablePartialResultsStabilization x-amzn-transcribe-partial-results-stability: PartialResultsStability x-amzn-transcribe-content-identification-type: ContentIdentificationType x-amzn-transcribe-content-redaction-type: ContentRedactionType x-amzn-transcribe-pii-entity-types: PiiEntityTypes Content-type: application/json { "CallAnalyticsTranscriptResultStream": { "BadRequestException": { }, "CategoryEvent": { "MatchedCategories": [ "string" ], "MatchedDetails": { "string" : { "TimestampRanges": [ { "BeginOffsetMillis": number, "EndOffsetMillis": number } ] } } }, "ConflictException": { }, "InternalFailureException": { }, "LimitExceededException": { }, "ServiceUnavailableException": { }, "UtteranceEvent": { "BeginOffsetMillis": number, "EndOffsetMillis": number, "Entities": [ { "BeginOffsetMillis": number, "Category": "string", "Confidence": number, "Content": "string", "EndOffsetMillis": number, "Type": "string" } ], "IsPartial": boolean, "IssuesDetected": [ { "CharacterOffsets": { "Begin": number, "End": number } } ], "Items": [ { "BeginOffsetMillis": number, "Confidence": number, "Content": "string", "EndOffsetMillis": number, "Stable": boolean, "Type": "string", "VocabularyFilterMatch": boolean } ], "ParticipantRole": "string", "Sentiment": "string", "Transcript": "string", "UtteranceId": "string" } } }

Elementos de resposta

Se a ação for bem-sucedida, o serviço reenviará uma resposta HTTP 200.

A resposta retorna os cabeçalhos HTTP a seguir.

ContentIdentificationType

Mostra se a identificação de conteúdo foi ativada para sua transcrição do Call Analytics.

Valores válidos: PII

ContentRedactionType

Mostra se a redação do conteúdo foi ativada para sua transcrição do Call Analytics.

Valores válidos: PII

EnablePartialResultsStabilization

Mostra se a estabilização parcial dos resultados foi ativada para sua transcrição do Call Analytics.

LanguageCode

Fornece o código de idioma que você especificou em sua solicitação do Call Analytics.

Valores válidos: en-US | en-GB | es-US | fr-CA | fr-FR | en-AU | it-IT | de-DE | pt-BR

LanguageModelName

Fornece o nome do modelo de idioma personalizado que você especificou na solicitação do Call Analytics.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

MediaEncoding

Fornece a codificação de mídia que você especificou em sua solicitação do Call Analytics.

Valores válidos: pcm | ogg-opus | flac

MediaSampleRateHertz

Fornece a taxa de amostragem que você especificou em sua solicitação do Call Analytics.

Intervalo válido: valor mínimo de 8000. Valor máximo de 48000.

PartialResultsStability

Fornece o nível de estabilização usado para sua transcrição.

Valores válidos: high | medium | low

PiiEntityTypes

Lista os tipos de entidades de PII que você especificou em sua solicitação do Call Analytics.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 300.

Padrão: ^[A-Z_, ]+

RequestId

Fornece o identificador para sua solicitação de análise de chamadas em tempo real.

SessionId

Fornece o identificador para sua sessão de transcrição do Call Analytics.

Restrições de comprimento: comprimento fixo de 36.

Padrão: [a-fA-F0-9]{8}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{4}-[a-fA-F0-9]{12}

VocabularyFilterMethod

Fornece o método de filtragem de vocabulário usado em sua transcrição do Call Analytics.

Valores válidos: remove | mask | tag

VocabularyFilterName

Fornece o nome do filtro de vocabulário personalizado que você especificou na solicitação do Call Analytics.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

VocabularyName

Fornece o nome do vocabulário personalizado que você especificou na solicitação do Call Analytics.

Restrições de tamanho: tamanho mínimo 1. Tamanho máximo de 200.

Padrão: ^[0-9a-zA-Z._-]+

Os seguintes dados são retornados no formato JSON pelo serviço.

CallAnalyticsTranscriptResultStream

Fornece informações detalhadas sobre sua sessão de análise de chamadas em tempo real.

Tipo: objeto CallAnalyticsTranscriptResultStream

Erros

Para obter informações sobre os erros comuns a todas as ações, consulteErros comuns.

BadRequestException

Um ou mais argumentos para aStartCallAnalyticsStreamTranscription operaçãoStartStreamTranscriptionStartMedicalStreamTranscription, ou não eram válidos. Por exemplo,MediaEncoding ouLanguageCode usou valores não suportados. Verifique os parâmetros especificados e tente fazer sua solicitação novamente.

Código de status HTTP: 400

ConflictException

Um novo stream começou com o mesmo ID de sessão. O fluxo atual foi encerrado.

Código de status HTTP: 409

InternalFailureException

Ocorreu um problema ao processar o áudio. O Amazon Transcribe encerrou o processamento.

Código de status HTTP: 500

LimitExceededException

Seu cliente ultrapassou um dos limites do Amazon Transcribe. Normalmente, esse é o limite de duração do áudio. Divida seu fluxo de áudio em partes menores e tente fazer sua solicitação novamente.

Código de status HTTP: 429

ServiceUnavailableException

O serviço está indisponível no momento. Experimente sua solicitação mais tarde.

Código de status HTTP: 503

Consulte também

Para obter mais informações sobre como usar essa API em um dos AWS SDKs específicos de linguagem, consulte o seguinte: