Tipos de marcas de voz - Amazon Polly

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Tipos de marcas de voz

Puede solicitar las marcas de voz mediante la opción SpeechMarkTypes para los comandos SynthesizeSpeech o StartSpeechSynthesisTask. Debe especificar los metadatos del texto de entrada que quiere que se devuelvan. Puede solicitar hasta cuatro tipos de metadatos y debe especificar al menos uno en cada solicitud. Esta solicitud no genera ninguna salida de audio.

En la AWS CLI, por ejemplo:

--speech-mark-types='["sentence", "word", "viseme", "ssml"]'

Amazon Polly genera las marcas de voz utilizando los siguientes elementos:

  • sentence: sirve para señalar frases en el texto de entrada.

  • word: sirve para señalar palabras en el texto.

  • viseme: describe los movimientos de la cara y la boca que corresponden a cada fonema que se pronuncia. Para obtener más información, consulte Visemas y Amazon Polly.

  • ssml describe un elemento <mark> del texto de entrada SSML. Para obtener más información, consulte Generación de voz a partir de SSML documentos.