Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Las marcas de voz se solicitan mediante la SpeechMarkTypesopción de los StartSpeechSynthesisTaskcomandos SynthesizeSpeecho. Debe especificar los metadatos del texto de entrada que quiere que se devuelvan. Puede solicitar hasta cuatro tipos de metadatos y debe especificar al menos uno en cada solicitud. Esta solicitud no genera ninguna salida de audio.
En AWS CLI, por ejemplo:
--speech-mark-types='["sentence", "word", "viseme", "ssml"]'
Amazon Polly genera las marcas de voz utilizando los siguientes elementos:
-
sentence: sirve para señalar frases en el texto de entrada.
-
word: sirve para señalar palabras en el texto.
-
viseme: describe los movimientos de la cara y la boca que corresponden a cada fonema que se pronuncia. Para obtener más información, consulte Visemas y Amazon Polly.
-
ssml describe un elemento <mark> del texto de entrada SSML. Para obtener más información, consulte Generación de fragmentos hablados desde documentos SSML.