Seleziona le tue preferenze relative ai cookie

Utilizziamo cookie essenziali e strumenti simili necessari per fornire il nostro sito e i nostri servizi. Utilizziamo i cookie prestazionali per raccogliere statistiche anonime in modo da poter capire come i clienti utilizzano il nostro sito e apportare miglioramenti. I cookie essenziali non possono essere disattivati, ma puoi fare clic su \"Personalizza\" o \"Rifiuta\" per rifiutare i cookie prestazionali.

Se sei d'accordo, AWS e le terze parti approvate utilizzeranno i cookie anche per fornire utili funzionalità del sito, ricordare le tue preferenze e visualizzare contenuti pertinenti, inclusa la pubblicità pertinente. Per continuare senza accettare questi cookie, fai clic su \"Continua\" o \"Rifiuta\". Per effettuare scelte più dettagliate o saperne di più, fai clic su \"Personalizza\".

Controllo del volume, della velocità di conversazione e dell'intonazione

Modalità Focus
Controllo del volume, della velocità di conversazione e dell'intonazione - Amazon Polly

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

<prosody>

Gli attributi dei tag Prosody sono completamente supportati dalle voci TTS standard. Le voci generative, neurali e in forma lunga supportano gli rate attributi volume and, ma non supportano l'attributo. pitch Per le voci generative, il tag prosody può essere usato solo intorno a frasi complete.

Per controllare il volume, la velocità o l'intonazione della voce selezionata, utilizza il tag prosody.

Il volume, la velocità della sintesi vocale e l'intonazione dipendono dalla voce specifica selezionata. Oltre alle differenze tra voci per diversi linguaggi, ci sono differenze tra le singole voci che parlano la stessa lingua. Per questo motivo, mentre gli attributi sono simili in tutti i linguaggi, ci sono chiare varianti da lingua a lingua e nessun valore assoluto è disponibile.

Il tag prosody ha tre attributi, ognuno dei quali dispone di diversi valori disponibili per impostare l'attributo. Ogni attributo utilizza la stessa sintassi:

<prosody attribute="value"></prosody>

  • volume

    • default: reimposta il volume sul livello di default per la voce corrente.

    • silent, x-soft, soft, medium, loud, x-loud: consente di specificare il volume su un valore di default per la voce corrente.

    • +ndB, -ndB: modifica il volume in relazione al livello corrente. Il valore +0dB indica che il volume rimane invariato, mentre +6dB indica circa il doppio dell'attuale volume e -6dB indica circa la metà dell'attuale volume.

    Ad esempio, è possibile impostare il volume per un passaggio come segue:

    <speak> Sometimes it can be useful to <prosody volume="loud">increase the volume for a specific speech.</prosody> </speak>

    In alternativa, puoi impostarlo in questo modo:

    <speak> And sometimes a lower volume <prosody volume="-6dB">is a more effective way of interacting with your audience.</prosody> </speak>
  • rate

    • x-slow, slow, medium, fast,x-fast. Impostare l'intonazione su un valore predefinito per la voce selezionata.

    • n%: Una modifica della percentuale non negativa nella velocità di pronuncia. Ad esempio, un valore di 100% significa nessun cambiamento alla velocità di pronuncia, un valore pari a 200% significa una velocità di pronuncia il doppio della velocità predefinita e un valore del 50% significa una velocità di pronuncia la metà della velocità predefinita. Questo valore ha un intervallo di 20-200%.

    Ad esempio, è possibile impostare la velocità della sintesi vocale per un passaggio come segue:

    <speak> For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking rate of your text.</prosody> </speak>

    In alternativa, puoi impostarlo in questo modo:

    <speak> Although in some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
  • pitch

    • default: reimposta l'intonazione sul livello di default per la voce corrente.

    • x-low, low, medium, high, x-high: imposta l'intonazione su un valore predefinito per la voce corrente.

    • +n% o -n%: regola l'intonazione in base a una percentuale relativa. Ad esempio, un valore di +0% significa che non c'è alcun cambiamento nell'intonazione di base, +5% offre un'intonazione di base leggermente più elevata, mentre -5% avrà come risultato un'intonazione di base leggermente inferiore.

    Ad esempio, è possibile impostare l'intonazione per un passaggio come segue:

    <speak> Do you like sythesized speech <prosody pitch="high">with a pitch that is higher than normal?</prosody> </speak>

    In alternativa, puoi impostarlo in questo modo:

    <speak> Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody> </speak>

Il tag <prosody > deve contenere almeno un attributo, ma può includerne di più all'interno dello stesso tag.

<speak> Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak quite slowly and deliberately until I have my coffee.</prosody> </speak>

Può anche essere combinato con tag nidificati, come segue:

<speak> <prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can change the impression your audience has of a voice</prosody> as well.</prosody> </speak>

PrivacyCondizioni del sitoPreferenze cookie
© 2025, Amazon Web Services, Inc. o società affiliate. Tutti i diritti riservati.