Ejemplo de marcas de voz con SSML

Modo de enfoque

Ejemplo de marcas de voz con SSML - Amazon Polly

El proceso de generar marcas de voz desde un texto mejorado con SSML es muy parecido al proceso que se utiliza cuando SSML no está presente. Utilice el comando synthesize-speech, especifique el texto mejorado con SSML y determine el tipo de marcas de voz que desea usar, tal y como se muestra en el ejemplo siguiente. Para que el ejemplo resulte más fácil de leer, no hemos incluido las marcas de voz de los visemas, pero también podrían incluirse.

El siguiente AWS CLI ejemplo está formateado para Unix, Linux y macOS. En Windows, sustituya la barra invertida (\) del carácter de continuación de Unix al final de cada línea por un signo de intercalación (^) y utilice comillas completas (") alrededor del texto introducido con comillas simples (') para las etiquetas interiores.


aws polly synthesize-speech \
  --output-format json \
  --voice-id Joanna \
  --text-type ssml \
  --text '<speak><prosody volume="+20dB">Mary had <break time="300ms"/>a little <mark name="animal"/>lamb</prosody></speak>' \
  --speech-mark-types='["sentence", "word", "ssml"]' \
  output.txt

Si realiza esta solicitud, Amazon Polly devuelve lo siguiente en el archivo .txt:


{"time":0,"type":"sentence","start":31,"end":95,"value":"Mary had <break time=\"300ms\"\/>a little <mark name=\"animal\"\/>lamb"}
{"time":6,"type":"word","start":31,"end":35,"value":"Mary"}
{"time":325,"type":"word","start":36,"end":39,"value":"had"}
{"time":897,"type":"word","start":40,"end":61,"value":"<break time=\"300ms\"\/>"}
{"time":1291,"type":"word","start":61,"end":62,"value":"a"}
{"time":1373,"type":"word","start":63,"end":69,"value":"little"}
{"time":1635,"type":"ssml","start":70,"end":91,"value":"animal"}
{"time":1635,"type":"word","start":91,"end":95,"value":"lamb"}