Identificação de idioma com transcrições de streaming

Modo de foco

Identificação de idioma com transcrições de streaming - Amazon Transcribe

Identificação de idiomas em áudio com vários idiomas Usar a identificação de idioma com streaming de mídia

A identificação do idioma de streaming pode identificar o idioma dominante falado em seu stream de mídia. Amazon Transcribe requer um mínimo de três segundos de fala para identificar o idioma.

Se o streaming tiver apenas um idioma, você poderá habilitar a identificação de um único idioma, que identifica o idioma dominante falado no arquivo de mídia e cria a transcrição usando somente esse idioma.

Se o streaming tiver mais de um idioma, você poderá habilitar a identificação de vários idiomas, que identifica todos os idiomas falados no streaming e cria a transcrição usando cada idioma identificado. Observe que uma transcrição de vários idiomas é produzida. Você pode usar outros serviços Amazon Transcribe, como traduzir sua transcrição.

Para usar a identificação de idioma de streaming, você deve fornecer pelo menos dois códigos de idioma e pode selecionar somente um dialeto por idioma e por streaming. Isso significa que não é possível selecionar en-US e en-AU como opções de idioma para a mesma transcrição.

Você também tem a opção de selecionar um idioma de sua preferência no conjunto de códigos de idioma fornecido. Adicionar um idioma preferencial pode acelerar o processo de identificação do idioma, o que é útil para clipes de áudio curtos.

Importante

Se nenhum dos códigos de idioma fornecidos corresponder ao idioma ou idiomas identificados em seu áudio, Amazon Transcribe selecionará a correspondência de idioma mais próxima dos códigos de idioma especificados. Em seguida, ele produz uma transcrição nesse idioma. Por exemplo, se sua mídia estiver em inglês dos EUA (en-US) e você Amazon Transcribe fornecer os códigos de idiomazh-CN, e fr-FRde-DE, Amazon Transcribe provavelmente corresponderá sua mídia ao alemão (de-DE) e produzirá uma transcrição em alemão. A incompatibilidade entre códigos de idioma e idiomas falados pode resultar em uma transcrição imprecisa; portanto, recomendamos cautela ao incluir códigos de idioma.

Se sua mídia contiver dois canais, Amazon Transcribe poderá identificar o idioma dominante falado em cada canal. Nesse caso, defina o parâmetro ChannelIdentification como true, e cada canal será transcrito separadamente. Observe que o padrão para esse parâmetro é false. Se você não alterar, apenas o primeiro canal será transcrito e somente um idioma será identificado.

A identificação de idioma de streaming não pode ser combinada com modelos de idioma personalizados ou edição. Ao combinar a identificação de idioma com outros recursos, você se limitará aos idiomas compatíveis com esses recursos e também com transcrições de streaming. Consulte Idiomas oferecidos.

nota

PCM e FLAC são os únicos formatos de áudio compatíveis para identificação de idiomas de streaming.

Identificação de idiomas em áudio com vários idiomas

A identificação de vários idiomas é destinada a streamings com vários idiomas e fornece uma transcrição que reflete todos os idiomas compatíveis falados no streaming. Isso significa que, se os locutores mudarem de idioma no meio da conversa ou se cada participante falar um idioma diferente, a saída de transcrição detectará e transcreverá cada idioma corretamente.

Por exemplo, se o streaming tiver um locutor bilíngue que alterne entre inglês dos EUA (en-US) e hindi (hi-IN), a identificação de vários idiomas poderá identificar e transcrever o inglês dos EUA falado como en-US e o hindi falado como hi-IN. Isso difere da identificação de um único idioma, em que apenas um idioma dominante é usado para criar uma transcrição. Nesse caso, qualquer idioma falado que não seja o dominante é transcrito incorretamente.

nota

Atualmente, os modelos de edição e de linguagem personalizada não são compatíveis com a identificação de vários idiomas.

Usar a identificação de idioma com streaming de mídia

Você pode usar a identificação automática de idioma em uma transcrição de streaming usando o AWS Management Console, HTTP/2 ou WebSockets; veja exemplos a seguir:

Faça login no AWS Management Console.
No painel de navegação, escolha Transcrição em tempo real. Role para baixo até Configurações de idioma e expanda esse campo se ele estiver minimizado.
Selecione Identificação automática de idioma ou Identificação automática de vários idiomas.
Forneça no mínimo dois códigos de idioma para a transcrição. Observe que você pode fornecer somente um dialeto por idioma. Por exemplo, você não pode selecionar en-US e fr-CA como opções de idioma para a mesma transcrição.
(Opcional) No subconjunto de idiomas que você selecionou na etapa anterior, é possível escolher um idioma preferencial para a transcrição.
Agora está tudo pronto para transcrever seu fluxo. Selecione Iniciar transmissão e comece a falar. Para finalizar o ditado, selecione Interromper transmissão.

AWS Management Console

Faça login no AWS Management Console.
No painel de navegação, escolha Transcrição em tempo real. Role para baixo até Configurações de idioma e expanda esse campo se ele estiver minimizado.
Selecione Identificação automática de idioma ou Identificação automática de vários idiomas.
Forneça no mínimo dois códigos de idioma para a transcrição. Observe que você pode fornecer somente um dialeto por idioma. Por exemplo, você não pode selecionar en-US e fr-CA como opções de idioma para a mesma transcrição.
(Opcional) No subconjunto de idiomas que você selecionou na etapa anterior, é possível escolher um idioma preferencial para a transcrição.
Agora está tudo pronto para transcrever seu fluxo. Selecione Iniciar transmissão e comece a falar. Para finalizar o ditado, selecione Interromper transmissão.

Este exemplo cria uma solicitação HTTP/2 com a identificação de idioma habilitada. Para obter mais informações sobre como usar o streaming HTTP/2 com Amazon Transcribe, consulte. Configurar um fluxo de HTTP/2 Para obter mais detalhes sobre parâmetros e cabeçalhos específicos de Amazon Transcribe, consulte StartStreamTranscription.


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-language: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked

Este exemplo cria uma solicitação HTTP/2 com a identificação de vários idiomas habilitada. Para obter mais informações sobre como usar o streaming HTTP/2 com Amazon Transcribe, consulte. Configurar um fluxo de HTTP/2 Para obter mais detalhes sobre parâmetros e cabeçalhos específicos de Amazon Transcribe, consulte StartStreamTranscription.


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-multiple-languages: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked

Se você usar identify-language ou identify-multiple-languages na solicitação, também deverá incluir language-options. Você não pode usar language-code e identify-language na mesma solicitação.

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

Fluxo HTTP/2


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-language: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked


POST /stream-transcription HTTP/2
host: transcribestreaming.us-west-2.amazonaws.com
X-Amz-Target: com.amazonaws.transcribe.Transcribe.StartStreamTranscription
Content-Type: application/vnd.amazon.eventstream
X-Amz-Content-Sha256: string
X-Amz-Date: 20220208T235959Z
Authorization: AWS4-HMAC-SHA256 Credential=access-key/20220208/us-west-2/transcribe/aws4_request, SignedHeaders=content-type;host;x-amz-content-sha256;x-amz-date;x-amz-target;x-amz-security-token, Signature=string
x-amzn-transcribe-media-encoding: flac
x-amzn-transcribe-sample-rate: 16000    
x-amzn-transcribe-identify-multiple-languages: true
x-amzn-transcribe-language-options: en-US,de-DE
x-amzn-transcribe-preferred-language: en-US
transfer-encoding: chunked

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

Este exemplo cria uma URL pré-assinada que usa identificação de idioma em um WebSocket stream. Quebras de linha foram adicionadas para uma melhor leitura. Para obter mais informações sobre o uso de WebSocket fluxos com Amazon Transcribe, consulteConfigurando um WebSocket stream. Para obter mais detalhes sobre os parâmetros, consulte StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-language=true
&language-options=en-US,de-DE
&preferred-language=en-US

Este exemplo cria uma URL pré-assinada que usa a identificação de vários idiomas em um WebSocket stream. Quebras de linha foram adicionadas para uma melhor leitura. Para obter mais informações sobre o uso de WebSocket fluxos com Amazon Transcribe, consulteConfigurando um WebSocket stream. Consulte mais detalhes sobre os parâmetros em StartStreamTranscription.


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-multiple-languages=true
&language-options=en-US,de-DE
&preferred-language=en-US

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

WebSocket stream


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-language=true
&language-options=en-US,de-DE
&preferred-language=en-US


GET wss://transcribestreaming.us-west-2.amazonaws.com:8443/stream-transcription-websocket?
&X-Amz-Algorithm=AWS4-HMAC-SHA256
&X-Amz-Credential=AKIAIOSFODNN7EXAMPLE%2F20220208%2Fus-west-2%2Ftranscribe%2Faws4_request
&X-Amz-Date=20220208T235959Z
&X-Amz-Expires=300
&X-Amz-Security-Token=security-token
&X-Amz-Signature=string
&X-Amz-SignedHeaders=content-type%3Bhost%3Bx-amz-date
&media-encoding=flac
&sample-rate=16000
&identify-multiple-languages=true
&language-options=en-US,de-DE
&preferred-language=en-US

As definições de parâmetros podem ser encontradas na Referência da API; os parâmetros comuns a todas as operações AWS da API estão listados na seção Parâmetros comuns.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Identificação de idioma em lote

Transcrições alternativas

Próximo tópico:

Transcrições alternativas

Tópico anterior:

Identificação de idioma em lote

Precisa de ajuda?

Nesta página

Esta página foi útil?

Fornecer feedback

Privacidade Termos do site Preferências de cookies

Selecione suas preferências de cookies

Personalizar preferências de cookies

Essenciais

Desempenho

Funcionais

Publicidade

Não foi possível salvar as preferências de cookie

Identificação de idioma com transcrições de streaming

Importante

nota

Identificação de idiomas em áudio com vários idiomas

nota

Usar a identificação de idioma com streaming de mídia

AWS Management Console

Fluxo HTTP/2

WebSocket stream

Próximo tópico:

Tópico anterior:

Precisa de ajuda?

Nesta página

Esta página foi útil?

Amazon Transcribe captura de tela do console: a guia “configurações de idioma” fechada na página “transcrição em tempo real”.

Amazon Transcribe captura de tela do console: a guia expandida de 'configurações de idioma'.

Amazon Transcribe captura de tela do console: o menu suspenso de seleção do código de idioma.

Amazon Transcribe captura de tela do console: o painel de 'configurações de idioma' com as opções de idioma preferidas.