Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Sincronizar a velocidade da voz

Modo de foco
Sincronizar a velocidade da voz - Amazon Polly

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Devido à variação natural entre as vozes, cada voz disponível fala em velocidades ligeiramente diferentes. Por exemplo, no caso das vozes em inglês dos EUA, Ivy e Joanna são um pouco mais rápidas do que Matthew e consideravelmente mais rápidas que Joey. Como há muitas variações entre as vozes, não há velocidade padrão (palavras por minuto) disponível para as vozes do Amazon Polly. No entanto, você pode descobrir o tempo necessário para a voz dizer o texto selecionado usando as marcações de fala.

Como cronometrar a duração de uma passagem de texto falada
  1. Abra AWS CLI o.

  2. Execute o código a seguir, preenchendo conforme o necessário.

    aws polly synthesize-speech \ --language-code optional language code if needed --output-format json \ --voice-id [name of desired voice] \ --text '[desired text]' \ --speech-mark-types='["viseme"]' \ LengthOfText.txt
  3. Abra o LengthOfText.txt.

Se o texto fosse "Mary had a little lamb", as últimas linhas retornadas pelo Amazon Polly seriam:

{"time":882,"type":"viseme","value":"t"} {"time":964,"type":"viseme","value":"a"} {"time":1082,"type":"viseme","value":"p"}

O último visema, essencialmente o som para as últimas letras em "lamb", começa 1.082 milissegundos após o início da fala. Embora essa não seja exatamente a duração do áudio, é próxima e pode servir como base de comparação entre vozes.

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.