Identificação de idioma com transcrições de streaming - Amazon Transcribe

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Identificação de idioma com transcrições de streaming

A identificação do idioma de streaming pode identificar o idioma dominante falado no streaming de mídia. O Amazon Transcribe requer um mínimo de três segundos de fala para identificar o idioma.

Se o streaming tiver apenas um idioma, você poderá habilitar a identificação de um único idioma, que identifica o idioma dominante falado no arquivo de mídia e cria a transcrição usando somente esse idioma.

Se o streaming tiver mais de um idioma, você poderá habilitar a identificação de vários idiomas, que identifica todos os idiomas falados no streaming e cria a transcrição usando cada idioma identificado. Observe que uma transcrição de vários idiomas é produzida. É possível usar outros serviços, como o Amazon Transcribe, para traduzir a transcrição.

Para usar a identificação do idioma de streaming, você deve fornecer pelo menos dois códigos de idioma e pode selecionar somente um dialeto de idioma, por idioma e por streaming. Isso significa que você não pode selecionar en-US e en-AU como opções de idioma para a mesma transcrição.

Você também tem a opção de selecionar um idioma preferido no conjunto de códigos de idioma fornecido. Adicionar um idioma preferencial pode acelerar o processo de identificação do idioma, o que é útil para clipes de áudio curtos.

Importante

Se nenhum dos códigos de idioma fornecidos corresponder ao idioma ou idiomas identificados no áudio, o Amazon Transcribe selecionará o idioma mais próximo entre os códigos de idioma especificados. Depois, ele produz uma transcrição nesse idioma. Por exemplo, se a mídia estiver em inglês dos EUA (en-US) e você Amazon Transcribe fornecer os códigos de idioma zh-CN, fr-FR e de-DE, o Amazon Transcribe provavelmente encontrará uma correspondência da mídia com o alemão (de-DE) e produzirá uma transcrição nesse idioma. A incompatibilidade entre códigos de idioma e os idiomas falados pode resultar em uma transcrição imprecisa, portanto, recomendamos cautela ao incluir códigos de idioma.

Se a mídia tiver dois canais, o Amazon Transcribe poderá identificar o idioma dominante falado em cada canal. Nesse caso, defina o parâmetro ChannelIdentification como true e cada canal será transcrito separadamente. Observe que o padrão para esse parâmetro é false. Se você não alterar, apenas o primeiro canal será transcrito e somente um idioma será identificado.

A identificação do idioma de streaming não pode ser combinada com modelos de idioma personalizados ou edição. Se combinar a identificação de idioma com outros recursos, você se limitará aos idiomas compatíveis com esses recursos e também com transcrições de streaming. Consulte Idiomas compatíveis.

nota

PCM e FLAC são os únicos formatos de áudio compatíveis para identificação de idiomas de streaming.

Identificação de idiomas em áudio com vários idiomas

A identificação de vários idiomas é destinada a streamings com vários idiomas e fornece uma transcrição que reflete todos os idiomas compatíveis falados no streaming. Isso significa que, se os locutores mudarem de idioma no meio da conversa ou se cada participante falar um idioma diferente, a saída de transcrição detectará e transcreverá cada idioma corretamente.

Por exemplo, se o streaming tiver um locutor bilíngue que alterne entre inglês dos EUA (en-US) e hindi (hi-IN), a identificação de vários idiomas poderá identificar e transcrever o inglês dos EUA falado como en-US e o hindi falado como hi-IN. Isso difere da identificação de um único idioma, em que apenas um idioma dominante é usado para criar uma transcrição. Nesse caso, qualquer idioma falado que não seja o dominante é transcrito incorretamente.

nota

Atualmente, os modelos de edição e de linguagem personalizada não são compatíveis com a identificação de vários idiomas.

Usar a identificação de idioma com streaming de mídia

É possível usar a identificação automática de idioma em uma transcrição de streaming usando o AWS Management Console, HTTP/2 ou WebSockets; veja exemplos a seguir:

  1. Faça login no AWS Management Console.

  2. No painel de navegação, escolha Transcrição em tempo real. Role para baixo até Configurações de idioma e expanda esse campo se ele estiver minimizado.

    Captura de tela do console do Amazon Transcribe: a guia “configurações de idioma” recolhida na página “transcrição em tempo real”.
  3. Selecione Identificação automática de idioma ou Identificação automática de vários idiomas.

    Captura de tela do console do Amazon Transcribe: a guia “configurações de idioma” expandida.
  4. Forneça no mínimo dois códigos de idioma para a transcrição. Observe que você pode fornecer somente um dialeto por idioma. Por exemplo, você não pode selecionar en-US e fr-CA como opções de idioma para a mesma transcrição.

    Captura de tela do console do Amazon Transcribe: o menu suspenso de seleção de código de idioma.
  5. (Opcional) No subconjunto de idiomas que você selecionou na etapa anterior, é possível escolher um idioma preferido para a transcrição.

    Captura de tela do console Amazon Transcribe: o painel “configurações de idioma” com as opções de idioma preferidas.
  6. Agora está tudo pronto para transcrever o streaming. Selecione Iniciar streaming e comece a falar. Para finalizar o ditado, selecione Interromper transmissão.

Este exemplo cria uma solicitação HTTP/2 com a identificação de idioma habilitada. Consulte mais informações sobre como usar o streaming HTTP/2 com o Amazon Transcribe em Configurando um stream HTTP /2. Consulte mais detalhes sobre parâmetros e cabeçalhos específicos do Amazon Transcribe em StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-language: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

Este exemplo cria uma solicitação HTTP/2 com a identificação de vários idiomas habilitada. Consulte mais informações sobre como usar o streaming HTTP/2 com o Amazon Transcribe em Configurando um stream HTTP /2. Consulte mais detalhes sobre parâmetros e cabeçalhos específicos do Amazon Transcribe em StartStreamTranscription.

POST /stream-transcription HTTP/2 host: transcribestreaming.us-west-2.amazonaws.com X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription Content-Type: application/vnd.amazon.eventstream X-Amz-Content-Sha256: string X-Amz-Date: 20220208T235959Z Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string x-amzn-transcribe-media-encoding: flac x-amzn-transcribe-sample-rate: 16000 x-amzn-transcribe-identify-multiple-languages: true x-amzn-transcribe-language-options: en-US,de-DE x-amzn-transcribe-preferred-language: en-US transfer-encoding: chunked

Se você usar identify-language ou identify-multiple-languages na solicitação, também deverá incluir language-options. Você não pode usar language-code e identify-language na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações da AWS API estão listados na seção Parâmetros comuns.

Este exemplo cria um URL pré-assinado que usa identificação de idioma em um streaming do WebSocket. Quebras de linha foram adicionadas para uma melhor leitura. Consulte mais informações sobre o uso de streamings do WebSocket com o Amazon Transcribe em Configurando um WebSocket stream. Consulte mais detalhes sobre os parâmetros em StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-language=true &language-options=en-US,de-DE &preferred-language=en-US

Este exemplo cria um URL pré-assinado que usa identificação de vários idiomas em um streaming do WebSocket. Quebras de linha foram adicionadas para uma melhor leitura. Consulte mais informações sobre o uso de streamings do WebSocket com o Amazon Transcribe em Configurando um WebSocket stream. Consulte mais detalhes sobre os parâmetros em StartStreamTranscription.

GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket? &X-Amz-Algorithm=AWS4-HMAC-SHA256 &X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request &X-Amz-Date=20220208T235959Z &X-Amz-Expires=300 &X-Amz-Security-Token=security-token &X-Amz-Signature=string &X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date &media-encoding=flac &sample-rate=16000 &identify-multiple-languages=true &language-options=en-US,de-DE &preferred-language=en-US

Se você usar identify-language ou identify-multiple-languages na solicitação, também deverá incluir language-options. Você não pode usar language-code e identify-language na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações da AWS API estão listados na seção Parâmetros comuns.