Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Identificação de idioma com transcrições de streaming

Modo de foco
Identificação de idioma com transcrições de streaming - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

A identificação do idioma de streaming pode identificar o idioma dominante falado em seu stream de mídia. Amazon Transcribe requer um mínimo de três segundos de fala para identificar o idioma.

Se o streaming tiver apenas um idioma, você poderá habilitar a identificação de um único idioma, que identifica o idioma dominante falado no arquivo de mídia e cria a transcrição usando somente esse idioma.

Se o streaming tiver mais de um idioma, você poderá habilitar a identificação de vários idiomas, que identifica todos os idiomas falados no streaming e cria a transcrição usando cada idioma identificado. Observe que uma transcrição de vários idiomas é produzida. Você pode usar outros serviços Amazon Transcribe, como traduzir sua transcrição.

Para usar a identificação de idioma de streaming, você deve fornecer pelo menos dois códigos de idioma e pode selecionar somente um dialeto por idioma e por streaming. Isso significa que não é possível selecionar en-US e en-AU como opções de idioma para a mesma transcrição.

Você também tem a opção de selecionar um idioma de sua preferência no conjunto de códigos de idioma fornecido. Adicionar um idioma preferencial pode acelerar o processo de identificação do idioma, o que é útil para clipes de áudio curtos.

Importante

Se nenhum dos códigos de idioma fornecidos corresponder ao idioma ou idiomas identificados em seu áudio, Amazon Transcribe selecionará a correspondência de idioma mais próxima dos códigos de idioma especificados. Em seguida, ele produz uma transcrição nesse idioma. Por exemplo, se sua mídia estiver em inglês dos EUA (en-US) e você Amazon Transcribe fornecer os códigos de idiomazh-CN, e fr-FRde-DE, Amazon Transcribe provavelmente corresponderá sua mídia ao alemão (de-DE) e produzirá uma transcrição em alemão. A incompatibilidade entre códigos de idioma e idiomas falados pode resultar em uma transcrição imprecisa; portanto, recomendamos cautela ao incluir códigos de idioma.

Se sua mídia contiver dois canais, Amazon Transcribe poderá identificar o idioma dominante falado em cada canal. Nesse caso, defina o parâmetro ChannelIdentification como true, e cada canal será transcrito separadamente. Observe que o padrão para esse parâmetro é false. Se você não alterar, apenas o primeiro canal será transcrito e somente um idioma será identificado.

A identificação de idioma de streaming não pode ser combinada com modelos de idioma personalizados ou edição. Ao combinar a identificação de idioma com outros recursos, você se limitará aos idiomas compatíveis com esses recursos e também com transcrições de streaming. Consulte Idiomas oferecidos.

nota

PCM e FLAC são os únicos formatos de áudio compatíveis para identificação de idiomas de streaming.

Identificação de idiomas em áudio com vários idiomas

A identificação de vários idiomas é destinada a streamings com vários idiomas e fornece uma transcrição que reflete todos os idiomas compatíveis falados no streaming. Isso significa que, se os locutores mudarem de idioma no meio da conversa ou se cada participante falar um idioma diferente, a saída de transcrição detectará e transcreverá cada idioma corretamente.

Por exemplo, se o streaming tiver um locutor bilíngue que alterne entre inglês dos EUA (en-US) e hindi (hi-IN), a identificação de vários idiomas poderá identificar e transcrever o inglês dos EUA falado como en-US e o hindi falado como hi-IN. Isso difere da identificação de um único idioma, em que apenas um idioma dominante é usado para criar uma transcrição. Nesse caso, qualquer idioma falado que não seja o dominante é transcrito incorretamente.

nota

Atualmente, os modelos de edição e de linguagem personalizada não são compatíveis com a identificação de vários idiomas.

Usar a identificação de idioma com streaming de mídia

Você pode usar a identificação automática de idioma em uma transcrição de streaming usando o AWS Management Console, HTTP/2 ou WebSockets; veja exemplos a seguir:

  1. Faça login no AWS Management Console.

  2. No painel de navegação, escolha Transcrição em tempo real. Role para baixo até Configurações de idioma e expanda esse campo se ele estiver minimizado.

    Amazon Transcribe captura de tela do console: a guia “configurações de idioma” fechada na página “transcrição em tempo real”.
  3. Selecione Identificação automática de idioma ou Identificação automática de vários idiomas.

    Amazon Transcribe captura de tela do console: a guia expandida de 'configurações de idioma'.
  4. Forneça no mínimo dois códigos de idioma para a transcrição. Observe que você pode fornecer somente um dialeto por idioma. Por exemplo, você não pode selecionar en-US e fr-CA como opções de idioma para a mesma transcrição.

    Amazon Transcribe captura de tela do console: o menu suspenso de seleção do código de idioma.
  5. (Opcional) No subconjunto de idiomas que você selecionou na etapa anterior, é possível escolher um idioma preferencial para a transcrição.

    Amazon Transcribe captura de tela do console: o painel de 'configurações de idioma' com as opções de idioma preferidas.
  6. Agora está tudo pronto para transcrever seu fluxo. Selecione Iniciar transmissão e comece a falar. Para finalizar o ditado, selecione Interromper transmissão.

  1. Faça login no AWS Management Console.

  2. No painel de navegação, escolha Transcrição em tempo real. Role para baixo até Configurações de idioma e expanda esse campo se ele estiver minimizado.

    Amazon Transcribe captura de tela do console: a guia “configurações de idioma” fechada na página “transcrição em tempo real”.
  3. Selecione Identificação automática de idioma ou Identificação automática de vários idiomas.

    Amazon Transcribe captura de tela do console: a guia expandida de 'configurações de idioma'.
  4. Forneça no mínimo dois códigos de idioma para a transcrição. Observe que você pode fornecer somente um dialeto por idioma. Por exemplo, você não pode selecionar en-US e fr-CA como opções de idioma para a mesma transcrição.

    Amazon Transcribe captura de tela do console: o menu suspenso de seleção do código de idioma.
  5. (Opcional) No subconjunto de idiomas que você selecionou na etapa anterior, é possível escolher um idioma preferencial para a transcrição.

    Amazon Transcribe captura de tela do console: o painel de 'configurações de idioma' com as opções de idioma preferidas.
  6. Agora está tudo pronto para transcrever seu fluxo. Selecione Iniciar transmissão e comece a falar. Para finalizar o ditado, selecione Interromper transmissão.

Este exemplo cria uma solicitação HTTP/2 com a identificação de idioma habilitada. Para obter mais informações sobre como usar o streaming HTTP/2 com Amazon Transcribe, consulte. Configurar um fluxo de HTTP/2 Para obter mais detalhes sobre parâmetros e cabeçalhos específicos de Amazon Transcribe, consulte StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-language: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

Este exemplo cria uma solicitação HTTP/2 com a identificação de vários idiomas habilitada. Para obter mais informações sobre como usar o streaming HTTP/2 com Amazon Transcribe, consulte. Configurar um fluxo de HTTP/2 Para obter mais detalhes sobre parâmetros e cabeçalhos específicos de Amazon Transcribe, consulte StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-multiple-languages: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

Se você usar identify-language ou identify-multiple-languages na solicitação, também deverá incluir language-options. Você não pode usar language-code e identify-language na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

Este exemplo cria uma solicitação HTTP/2 com a identificação de idioma habilitada. Para obter mais informações sobre como usar o streaming HTTP/2 com Amazon Transcribe, consulte. Configurar um fluxo de HTTP/2 Para obter mais detalhes sobre parâmetros e cabeçalhos específicos de Amazon Transcribe, consulte StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-language: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

Este exemplo cria uma solicitação HTTP/2 com a identificação de vários idiomas habilitada. Para obter mais informações sobre como usar o streaming HTTP/2 com Amazon Transcribe, consulte. Configurar um fluxo de HTTP/2 Para obter mais detalhes sobre parâmetros e cabeçalhos específicos de Amazon Transcribe, consulte StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-multiple-languages: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

Se você usar identify-language ou identify-multiple-languages na solicitação, também deverá incluir language-options. Você não pode usar language-code e identify-language na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

Este exemplo cria uma URL pré-assinada que usa identificação de idioma em um WebSocket stream. Quebras de linha foram adicionadas para uma melhor leitura. Para obter mais informações sobre o uso de WebSocket fluxos com Amazon Transcribe, consulteConfigurando um WebSocket stream. Para obter mais detalhes sobre os parâmetros, consulte StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-language=true &language-options=en-US,de-DE &preferred-language=en-US

Este exemplo cria uma URL pré-assinada que usa a identificação de vários idiomas em um WebSocket stream. Quebras de linha foram adicionadas para uma melhor leitura. Para obter mais informações sobre o uso de WebSocket fluxos com Amazon Transcribe, consulteConfigurando um WebSocket stream. Consulte mais detalhes sobre os parâmetros em StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-multiple-languages=true &language-options=en-US,de-DE &preferred-language=en-US

Se você usar identify-language ou identify-multiple-languages na solicitação, também deverá incluir language-options. Você não pode usar language-code e identify-language na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

Este exemplo cria uma URL pré-assinada que usa identificação de idioma em um WebSocket stream. Quebras de linha foram adicionadas para uma melhor leitura. Para obter mais informações sobre o uso de WebSocket fluxos com Amazon Transcribe, consulteConfigurando um WebSocket stream. Para obter mais detalhes sobre os parâmetros, consulte StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-language=true &language-options=en-US,de-DE &preferred-language=en-US

Este exemplo cria uma URL pré-assinada que usa a identificação de vários idiomas em um WebSocket stream. Quebras de linha foram adicionadas para uma melhor leitura. Para obter mais informações sobre o uso de WebSocket fluxos com Amazon Transcribe, consulteConfigurando um WebSocket stream. Consulte mais detalhes sobre os parâmetros em StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-multiple-languages=true &language-options=en-US,de-DE &preferred-language=en-US

Se você usar identify-language ou identify-multiple-languages na solicitação, também deverá incluir language-options. Você não pode usar language-code e identify-language na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.