Selecione suas preferências de cookies

Usamos cookies essenciais e ferramentas semelhantes que são necessárias para fornecer nosso site e serviços. Usamos cookies de desempenho para coletar estatísticas anônimas, para que possamos entender como os clientes usam nosso site e fazer as devidas melhorias. Cookies essenciais não podem ser desativados, mas você pode clicar em “Personalizar” ou “Recusar” para recusar cookies de desempenho.

Se você concordar, a AWS e terceiros aprovados também usarão cookies para fornecer recursos úteis do site, lembrar suas preferências e exibir conteúdo relevante, incluindo publicidade relevante. Para aceitar ou recusar todos os cookies não essenciais, clique em “Aceitar” ou “Recusar”. Para fazer escolhas mais detalhadas, clique em “Personalizar”.

Controlar o volume, a velocidade e o tom da fala

Modo de foco
Controlar o volume, a velocidade e o tom da fala - Amazon Polly

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

<prosody>

Os atributos das tags de prosódia são totalmente compatíveis com as vozes TTS padrão. As vozes generativas, neurais e de formato longo oferecem suporte aos rate atributos volume e, mas não oferecem suporte ao pitch atributo. Para vozes generativas, a tag de prosódia só pode ser usada em frases completas.

Para controlar o volume, a velocidade ou o tom da voz selecionada, use a tag prosody.

O volume, a taxa e o tom da fala dependem da voz selecionada. Além das diferenças entre vozes em idiomas diferentes, há diferenças entre vozes individuais falando o mesmo idioma. Por isso, embora os atributos sejam semelhantes em todos os idiomas, há variações nítidas entre idiomas e nenhum valor absoluto estará disponível.

A tag prosody tem três atributos, e cada um deles têm vários valores disponíveis para definir o atributo. Todos os atributos usam a mesma sintaxe:

<prosody attribute="value"></prosody>

  • volume

    • default: redefine o volume como o nível padrão da voz atual.

    • silent, x-soft, soft, medium, loud, x-loud: define o volume como um valor predefinido para a voz atual.

    • +ndB, -ndB: altera o volume com relação ao nível atual. Um valor de +0dB significa nenhuma alteração, +6dB significa aproximadamente o dobro do volume atual e -6dB significa aproximadamente metade do volume atual.

    Por exemplo, você pode definir o volume para um trecho das seguintes maneiras:

    <speak> Sometimes it can be useful to <prosody volume="loud">increase the volume for a specific speech.</prosody> </speak>

    Ou você pode definir assim:

    <speak> And sometimes a lower volume <prosody volume="-6dB">is a more effective way of interacting with your audience.</prosody> </speak>
  • rate

    • x-slow, slow, medium, fast e x-fast especificam o tom para um valor predefinido da voz selecionada.

    • n%: uma alteração de porcentagem não negativa na taxa da fala. Por exemplo, um valor de 100% significa nenhuma alteração na taxa da fala, 200% significa que a taxa é o dobro da taxa padrão e 50% que taxa é metade da taxa padrão. Esse valor varia de 20 a 200%.

    Por exemplo, você pode definir a taxa da fala para um trecho das seguintes maneiras:

    <speak> For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking rate of your text.</prosody> </speak>

    Ou você pode definir assim:

    <speak> Although in some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
  • pitch

    • default: redefine o tom como o nível padrão da voz atual.

    • x-low, low, medium, high, x-high: Define o tom do valor predefinido para a voz atual.

    • +n% ou -n%: Ajusta o tom por uma porcentagem relativa. Por exemplo, um valor de +0% significa nenhuma alteração no tom da linha de base, +5% fornece um tom de linha de base um pouco maior e -5% resulta em um tom de linha de base um pouco menor.

    Por exemplo, você pode definir o tom para um trecho das seguintes maneiras:

    <speak> Do you like sythesized speech <prosody pitch="high">with a pitch that is higher than normal?</prosody> </speak>

    Ou você pode definir assim:

    <speak> Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody> </speak>

A tag <prosody> deve conter pelo menos um atributo, mas pode incluir mais atributos na mesma tag.

<speak> Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak quite slowly and deliberately until I have my coffee.</prosody> </speak>

Ela também pode ser combinada com tags aninhadas da seguinte forma:

<speak> <prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can change the impression your audience has of a voice</prosody> as well.</prosody> </speak>

PrivacidadeTermos do sitePreferências de cookies
© 2025, Amazon Web Services, Inc. ou suas afiliadas. Todos os direitos reservados.