Steuerung von Lautstärke, Sprechgeschwindigkeit und Tonhöhe - Amazon Polly

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Steuerung von Lautstärke, Sprechgeschwindigkeit und Tonhöhe

<prosody>

Die Attribute des Prosody-Tags werden von den standardmäßigen TTS-Stimmen vollständig unterstützt. Neuronale Stimmen und Stimmen in Langform unterstützen die rate Attribute volume und, aber nicht das Attribut. pitch

Mit dem prosody-Tag können Sie Lautstärke, Geschwindigkeit und Tonlage Ihrer gewählten Stimme steuern.

Lautstärke, Sprechgeschwindigkeit und Tonlage sind von der jeweils gewählten Stimme abhängig. Neben den Unterschieden der Stimmen für verschiedene Sprachen gibt es auch Unterschiede zwischen Stimmen, die dieselbe Sprache sprechen. Hieraus erklärt sich, dass es trotz zwischen den Sprachen ähnlicher Attribute klare Unterschiede von Sprache zu Sprache gibt. Absolute Werte existieren nicht.

Das Tag prosody hat drei Attribute, für die jeweils unterschiedliche Werte verfügbar sind. Jedes Attribut verwendet die gleiche Syntax:

<prosody attribute="value"></prosody>

  • volume

    • default: Setzt die Lautstärke auf den Standardwert für die aktuelle Stimme zurück.

    • silent, x-soft, soft, medium, loud, x-loud: Legt die Lautstärke auf einen vordefinierten Wert für die aktuelle Stimme fest.

    • +ndB, -ndB: Ändert die Lautstärke relativ zum aktuellen Pegel. Ein Wert von +0dB bedeutet keine Änderung, +6dB bedeutet in etwa eine Verdoppelung der aktuellen Lautstärke und -6dB bedeutet ungefähr eine Halbierung der aktuellen Lautstärke.

    Sie können die Lautstärke für eine Passage beispielsweise folgendermaßen einstellen:

    <speak> Sometimes it can be useful to <prosody volume="loud">increase the volume for a specific speech.</prosody> </speak>

    Sie können die Lautstärke auch folgendermaßen festlegen:

    <speak> And sometimes a lower volume <prosody volume="-6dB">is a more effective way of interacting with your audience.</prosody> </speak>
  • rate

    • x-slow,slow, mediumfast,x-fast. Stellt die Tonhöhe auf einen vordefinierten Wert für die ausgewählte Stimme ein.

    • n%: Eine Änderung der Sprechgeschwindigkeit um einen Prozentsatz (nicht negativ). Beispiel: Ein Wert von 100 % bedeutet, dass die Sprechgeschwindigkeit unverändert bleibt. Ein Wert von 200 % bedeutet, dass die Sprechgeschwindigkeit verdoppelt, und ein Wert von 50 %, dass die Sprechgeschwindigkeit halbiert wird. Der Wert kann zwischen 20 und 200 % liegen.

    Sie können die Sprechgeschwindigkeit für eine Passage beispielsweise folgendermaßen einstellen:

    <speak> For dramatic purposes, you might wish to <prosody rate="slow">slow up the speaking rate of your text.</prosody> </speak>

    Sie können die Lautstärke auch folgendermaßen festlegen:

    <speak> Although in some cases, it might help your audience to <prosody rate="85%">slow the speaking rate slightly to aid in comprehension.</prosody> </speak>
  • pitch

    • default: Setzt die Tonlage auf den Standardwert für die aktuelle Stimme zurück.

    • x-low, low, medium, high, x-high: Legt die Tonlage auf einen vordefinierten Wert für die aktuelle Stimme fest.

    • +n% oder -n%: passt die Tonhöhe um einen relativen Prozentsatz an. Beispiel: Ein Wert von +0% bedeutet keine Änderung der Baseline-Tonhöhe, +5% führt zu einer etwas höheren Baseline-Tonhöhe und -5% führt zu einer etwas niedrigeren Baseline-Tonhöhe.

    Sie können die Tonlage für eine Passage beispielsweise folgendermaßen einstellen:

    <speak> Do you like sythesized speech <prosody pitch="high">with a pitch that is higher than normal?</prosody> </speak>

    Sie können die Lautstärke auch folgendermaßen festlegen:

    <speak> Or do you prefer your speech <prosody pitch="-10%">with a somewhat lower pitch?</prosody> </speak>

Das Tag <prosody> muss mindestens ein Attribut, kann aber auch mehrere enthalten.

<speak> Each morning when I wake up, <prosody volume="loud" rate="x-slow">I speak quite slowly and deliberately until I have my coffee.</prosody> </speak>

Es kann zudem folgendermaßen mit verschachtelten Tags kombiniert werden:

<speak> <prosody rate="85%">Sometimes combining attributes <prosody pitch="-10%">can change the impression your audience has of a voice</prosody> as well.</prosody> </speak>