Generación de fragmentos hablados desde documentos SSML

Puede utilizar Amazon Polly para generar fragmentos hablados a partir de una entrada de texto sin formato o de documentos etiquetados con idioma de marcado de síntesis de voz (SSML). El uso de texto mejorado con SSML ofrece mayor control sobre el modo en que Amazon Polly genera el fragmento hablado a partir del texto proporcionado.

Con las etiquetas SSML, puede personalizar y controlar diferentes aspectos del fragmento hablado, como la pronunciación, el volumen y la velocidad de habla. En el AWS Management Console, el texto mejorado con SSML que desea convertir a audio se introduce en la pestaña SSML de la página. Text-to-Speech Aunque el texto que se escribe sin formato se basa en los valores predeterminados elegidos para el idioma y la voz, el texto mejorado con SSML indica a Amazon Polly no solo lo que se desea decir, sino también cómo se desea decirlo. Si se exceptúan las etiquetas SSML añadidas, Amazon Polly sintetiza el texto mejorado con SSML del mismo modo que sintetiza el texto sin formato. Para obtener más información, consulte Ejemplo de síntesis de voz con Amazon Polly.

Cuando utilice SSML, incluya todo el texto en una etiqueta <speak> para indicar a Amazon Polly que está utilizando SSML. Por ejemplo:


<speak>Hi! My name is Joanna. I will read any text you type here.</speak>

A continuación, utilice etiquetas SSML específicas en el texto que está dentro de las etiquetas <speak> para personalizar la forma en la que desea que suene el texto. Puede añadir una pausa, cambiar el ritmo de la locución, reducir o aumentar el volumen de la voz, o añadir muchas otras personalizaciones para hacer modo que el texto suene como usted desea. Para obtener una lista completa de las etiquetas SSML que puede utilizar, consulte Etiquetas SSML admitidas.

Por ejemplo, puede incluir una larga pausa dentro del texto o cambiar la velocidad de habla o el tono. Otras opciones incluyen:

enfatizar palabras o frases específicas
usar la pronunciación fonética
incluir sonidos de respiración
susurrar
usar el estilo de habla Newscaster.

Para obtener información completa sobre las etiquetas SSML admitidas por Amazon Polly y cómo utilizarlas, consulte Etiquetas SSML admitidas

Cuando se utiliza SSML, existen varios caracteres reservados que requieren un tratamiento especial. Esto se debe a que SSML utiliza estos caracteres como parte de su código. Para utilizarlos, debe usar una entidad específica para aplicarles caracteres de escape. Para obtener más información, consulte Caracteres reservados en SSML

Amazon Polly proporciona estos tipos de control con un subconjunto de etiquetas de marcado SSML, tal y como se especifica en la recomendación de W3C sobre idioma de marcado de síntesis de voz (SSML) versión 1.1.

Puede utilizar SSML en la consola de Amazon Polly o mediante la AWS CLI. En los siguientes temas se indica cómo puede utilizar SSML para generar fragmentos hablados y controlar la salida con precisión para que se adapte a sus necesidades.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Ejemplo de marcas de voz con SSML

Caracteres reservados