Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
<prosody>
Gli attributi dei tag Prosody sono completamente supportati dalle voci TTS standard. Le voci generative, neurali e in forma lunga supportano gli rate
attributi volume
and, ma non supportano l'attributo. pitch
Per le voci generative, il tag prosody può essere usato solo intorno a frasi complete.
Per controllare il volume, la velocità o l'intonazione della voce selezionata, utilizza il tag prosody
.
Il volume, la velocità della sintesi vocale e l'intonazione dipendono dalla voce specifica selezionata. Oltre alle differenze tra voci per diversi linguaggi, ci sono differenze tra le singole voci che parlano la stessa lingua. Per questo motivo, mentre gli attributi sono simili in tutti i linguaggi, ci sono chiare varianti da lingua a lingua e nessun valore assoluto è disponibile.
Il tag prosody
ha tre attributi, ognuno dei quali dispone di diversi valori disponibili per impostare l'attributo. Ogni attributo utilizza la stessa sintassi:
<prosody attribute
="value
"></prosody>
-
volume
-
default
: reimposta il volume sul livello di default per la voce corrente. -
silent
,x-soft
,soft
,medium
,loud
,x-loud
: consente di specificare il volume su un valore di default per la voce corrente. -
+ndB
,-ndB
: modifica il volume in relazione al livello corrente. Il valore+0dB
indica che il volume rimane invariato, mentre+6dB
indica circa il doppio dell'attuale volume e-6dB
indica circa la metà dell'attuale volume.
Ad esempio, è possibile impostare il volume per un passaggio come segue:
<speak> Sometimes it can be useful to <prosody volume="loud">increase the volume for a specific speech.</prosody> </speak>
In alternativa, puoi impostarlo in questo modo:
<speak> And sometimes a lower volume <prosody volume="-6dB">is a more effective way of interacting with your audience.</prosody> </speak>
-
-
rate
-
x-slow
,slow
,medium
,fast
,x-fast
. Impostare l'intonazione su un valore predefinito per la voce selezionata. -
n%
: Una modifica della percentuale non negativa nella velocità di pronuncia. Ad esempio, un valore di 100% significa nessun cambiamento alla velocità di pronuncia, un valore pari a 200% significa una velocità di pronuncia il doppio della velocità predefinita e un valore del 50% significa una velocità di pronuncia la metà della velocità predefinita. Questo valore ha un intervallo di 20-200%.
Ad esempio, è possibile impostare la velocità della sintesi vocale per un passaggio come segue:
<speak> For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking rate of your text.</prosody> </speak>
In alternativa, puoi impostarlo in questo modo:
<speak> Although in some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
-
-
pitch
-
default
: reimposta l'intonazione sul livello di default per la voce corrente. -
x-low
,low
,medium
,high
,x-high
: imposta l'intonazione su un valore predefinito per la voce corrente. -
+n%
o-n%
: regola l'intonazione in base a una percentuale relativa. Ad esempio, un valore di+0%
significa che non c'è alcun cambiamento nell'intonazione di base,+5%
offre un'intonazione di base leggermente più elevata, mentre-5%
avrà come risultato un'intonazione di base leggermente inferiore.
Ad esempio, è possibile impostare l'intonazione per un passaggio come segue:
<speak> Do you like sythesized speech <prosody pitch="high">with a pitch that is higher than normal?</prosody> </speak>
In alternativa, puoi impostarlo in questo modo:
<speak> Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody> </speak>
-
Il tag <prosody > deve contenere almeno un attributo, ma può includerne di più all'interno dello stesso tag.
<speak> Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak quite slowly and deliberately until I have my coffee.</prosody> </speak>
Può anche essere combinato con tag nidificati, come segue:
<speak>
<prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can
change the impression your audience has of a voice</prosody> as well.</prosody>
</speak>