Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
<prosody amazon:max-duration>
Dieses Tag wird derzeit nur vom Standard-TTS-Format unterstützt.
Um zu steuern, wie lange eine Sprachausgabe dauern soll, wenn sie generiert wird, verwenden Sie das <prosody>
-Tag mit dem amazon:max-duration
-Attribut.
Die Dauer der Sprachsynthese variiert je nach gewählter Stimme geringfügig. Dies erschwert die Abstimmung von generierter Sprache mit Visualisierungen oder anderen Aktivitäten, die ein präzises Timing erfordern. Dieses Problem tritt verstärkt bei Übersetzungsanwendungen auf, da die Zeit, die benötigt wird, um bestimmte Phrasen zu sagen, je nach Sprache stark variieren kann.
Das <prosody amazon:max-duration>
-Tag passt die synthetisierte Sprache an die gewünschte Dauer an.
Dieses Tag verwendet folgende Syntax:
<prosody amazon:max-duration="time duration
">
Mit dem <prosody amazon:max-duration>
-Tag können Sie die Dauer in Sekunden oder Millisekunden festlegen:
-
: maximale Dauer in Sekunden.n
s -
: maximale Dauer in Millisekunden.n
ms
Beispiel: Der folgende gesprochene Text hat eine maximale Dauer von 2 Sekunden:
<speak>
<prosody amazon:max-duration="2s">
Human speech is a powerful way to communicate.
</prosody>
</speak>
Wenn Text innerhalb des Tags platziert wird, überschreitet er die angegebene Dauer nicht. Wenn die gewählte Stimme oder Sprache normalerweise länger als diese Dauer dauern würde, beschleunigt Amazon Polly die Sprache, sodass sie in die angegebene Dauer passt.
Wenn die angegebene Dauer länger ist, als es dauert, den Text mit normaler Geschwindigkeit zu lesen, liest Amazon Polly die Sprache normal vor. Es verlangsamt weder die Sprachausgabe noch werden Stilleperioden hinzugefügt. Die resultierende Audioausgabe ist also kürzer als angefordert.
Anmerkung
Amazon Polly erhöht die Geschwindigkeit nicht mehr als das Fünffache der normalen Geschwindigkeit. Wenn Text schneller gesprochen wird, ergibt er in der Regel keinen Sinn. Wenn eine Sprachausgabe auch bei maximaler Beschleunigung nicht in die angegebene Dauer passt, wird das Audiomaterial beschleunigt, ist dann jedoch länger als die angegebene Dauer.
Sie können einen einzelnen Satz oder mehrere Sätze innerhalb eines <prosody amazon:max-duration>
-Tags und mehrere <prosody amazon:max-duration>
-Tags in Ihrem Text verwenden.
Zum Beispiel:
<speak>
<prosody amazon:max-duration="2400ms">
Human speech is a powerful way to communicate.
</prosody>
<break strength="strong"/>
<prosody amazon:max-duration="5100ms">
Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo.
</prosody>
<break strength="strong"/>
<prosody amazon:max-duration="8900ms">
We naturally understand this information, which is why speech is ideal for creating applications where
a screen isn’t practical or possible, or simply isn’t convenient.
</prosody>
</speak>
Die Verwendung des <prosody amazon:max-duration>
Tags kann die Latenz erhöhen, wenn Amazon Polly synthetisierte Sprache zurückgibt. Der Grad der Latenz hängt von der Passage und ihrer Länge ab. Wir empfehlen die Verwendung von Text aus relativ kurzen Textpassagen.
Einschränkungen
Es gibt Einschränkungen sowohl bei der Verwendung des <prosody
amazon:max-duration>
-Tags als auch bei der Funktion des Tags mit anderen SSML-Tags:
-
Der Text innerhalb eines
<prosody amazon:max-duration>
-Tags kann nicht mehr als 1 500 Zeichen betragen. -
Sie können keine
<prosody amazon:max-duration>
-Tags verschachteln. Wenn Sie ein<prosody amazon:max-duration>
Etikett in ein anderes einfügen, ignoriert Amazon Polly das innere Etikett.Im folgenden Beispiel wird das
<prosody amazon:max-duration="5s">
-Tag ignoriert:<speak> <prosody amazon:max-duration="16s"> Human speech is a powerful way to communicate. <prosody amazon:max-duration="5s"> Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo. </prosody> We naturally understand this information, which is why speech is ideal for creating applications where a screen isn’t practical or possible, or simply isn’t convenient. </prosody> </speak>
-
Es ist nicht möglich, die
<prosody>
-Tags mit demrate
-Attribut innerhalb eines<prosody amazon:max-duration>
-Tags zu verwenden. Denn beide beeinflussen die Geschwindigkeit, mit der der Text gesprochen wird.Im folgenden Beispiel ignoriert Amazon Polly das
<prosody rate="2">
Tag:<speak> <prosody amazon:max-duration="7500ms"> Human speech is a powerful way to communicate. <prosody rate="2"> Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo. </prosody> </prosody> </speak>
Pausiert und max-duration
Bei der Verwendung Ihres max-duration
-Tags können Sie weiterhin Pausen in Ihren Text einfügen. Amazon Polly berücksichtigt jedoch die Länge der Pause bei der Berechnung der maximalen Sprachdauer. Darüber hinaus behält Amazon Polly die kurzen Pausen bei, die auftreten, wenn Kommas und Punkte innerhalb einer Passage stehen, und schließt die maximale Dauer ein.
Beispiel: Im folgenden Block kommen Pausen von 600 Millisekunden und die durch Kommata und Punkte verursachten Pausen innerhalb der 8-Sekunden-Sprachausgabe vor:
<speak>
<prosody amazon:max-duration="8s">
Human speech is a powerful way to communicate.
<break time="600ms"/>
Even a simple ‘Hello’ can convey a lot of information depending on the pitch, intonation, and tempo.
</prosody>
</speak>