Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Définition d'une durée maximale pour la synthèse vocale
<prosody amazon:max-duration>
Cette balise est actuellement prise en charge uniquement par le format TTS standard.
Pour contrôler la durée d'un discours lors de sa synthèse, utilisez la balise <prosody>
avec l'attribut amazon:max-duration
.
La durée de la synthèse vocale varie légèrement selon la voix sélectionnée. Par conséquent, il peut être difficile de faire correspondre la synthèse vocale à une présentation visuelle ou toute autre animation nécessitant un chronométrage précis. Ce problème est accentué pour les applications de traduction, car le temps nécessaire à la prononciation de certaines phrases peut varier de manière significative entre différentes langues.
La balise <prosody amazon:max-duration>
adapte la synthèse vocale à l'intervalle de temps que vous souhaitez définir (la durée).
Cette balise utilise la syntaxe suivante :
<prosody amazon:max-duration="time duration
">
La balise <prosody amazon:max-duration>
vous permet de spécifier la durée en secondes ou en millisecondes :
-
: durée maximale en secondesn
s -
: durée maximale en millisecondesn
ms
Par exemple, le texte parlé suivant a une durée maximale de 2 secondes :
<speak>
<prosody amazon:max-duration="2s">
Human speech is a powerful way to communicate.
</prosody>
</speak>
Le texte placé dans la balise ne dépasse pas la durée spécifiée. Si la voix ou la langue choisie prend normalement plus de temps que cette durée, Amazon Polly accélère le discours afin qu'il corresponde à la durée spécifiée.
Si la durée spécifiée est plus longue que nécessaire pour lire le texte à un rythme normal, Amazon Polly lit le discours normalement. Il ne ralentit pas le discours et n'ajoute pas de pauses. Ainsi, la synthèse vocale est plus courte que prévue.
Note
Amazon Polly n'augmente pas la vitesse plus de 5 fois par rapport au taux normal. Si le texte est énoncé à une vitesse encore plus rapide, il est probable que celui-ci ne sera pas intelligible. Si un discours ne peut pas être énoncé dans la durée que vous avez spécifiée, même lorsqu'il est accéléré au maximum, l'audio sera accéléré, mais durera plus longtemps que la durée spécifiée.
Vous pouvez inclure une ou plusieurs phrases dans une balise <prosody amazon:max-duration>
et utiliser plusieurs balises <prosody amazon:max-duration>
dans votre texte.
Par exemple :
<speak> <prosody amazon:max-duration="2400ms"> Human speech is a powerful way to communicate. </prosody> <break strength="strong"/> <prosody amazon:max-duration="5100ms"> Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo. </prosody> <break strength="strong"/> <prosody amazon:max-duration="8900ms"> We naturally understand this information, which is why speech is ideal for creating applications where a screen isn’t practical or possible, or simply isn’t convenient. </prosody> </speak>
L'utilisation de la <prosody amazon:max-duration>
balise peut augmenter le temps de latence lorsqu'Amazon Polly renvoie une synthèse vocale. Le temps de latence dépend du passage et de sa longueur. Nous vous recommandons de privilégier des textes composés de passages relativement courts.
Limites
Des limitations s'appliquent à votre utilisation de la balise <prosody
amazon:max-duration>
à son utilisation avec d'autres balises SSML :
-
Le texte placé à l'intérieur d'une balise
<prosody amazon:max-duration>
ne peut pas comporter plus de 1 500 caractères. -
Vous ne pouvez pas imbriquer de balises
<prosody amazon:max-duration>
. Si vous insérez une<prosody amazon:max-duration>
étiquette dans une autre, Amazon Polly ignore la balise intérieure.Par exemple, dans le code suivant, la balise
<prosody amazon:max-duration="5s">
est ignorée :<speak> <prosody amazon:max-duration="16s"> Human speech is a powerful way to communicate. <prosody amazon:max-duration="5s"> Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo. </prosody> We naturally understand this information, which is why speech is ideal for creating applications where a screen isn’t practical or possible, or simply isn’t convenient. </prosody> </speak>
-
Vous ne pouvez pas utiliser les balises
<prosody>
avec l'attributrate
dans une balise<prosody amazon:max-duration>
. En effet, les deux balises affectent la vitesse à laquelle le texte est énoncé.Dans l'exemple suivant, Amazon Polly ignore le tag :
<prosody rate="2">
<speak> <prosody amazon:max-duration="7500ms"> Human speech is a powerful way to communicate. <prosody rate="2"> Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo. </prosody> </prosody> </speak>
Pauses et max-duration
L'utilisation d'une balise max-duration
ne vous empêche pas d'insérer des pauses dans votre texte. Amazon Polly inclut toutefois la durée de la pause lors du calcul de la durée maximale de la parole. En outre, Amazon Polly préserve les courtes pauses qui se produisent lorsque des virgules et des points sont placés dans un passage et les inclut dans la durée maximale.
Par exemple, dans le bloc suivant, la pause de 600 millisecondes et les pauses générées par la présence de virgules et de points s'opèrent dans le discours de 8 secondes :
<speak> <prosody amazon:max-duration="8s"> Human speech is a powerful way to communicate. <break time="600ms"/> Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo. </prosody> </speak>