Generación de voz a partir de documentos SSML - Amazon Polly

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Generación de voz a partir de documentos SSML

Puede utilizar Amazon Polly para generar fragmentos hablados a partir de una entrada de texto sin formato o de documentos etiquetados con idioma de marcado de síntesis de voz (SSML). El uso de texto mejorado con SSML ofrece mayor control sobre el modo en que Amazon Polly genera el fragmento hablado a partir del texto proporcionado.

Por ejemplo, puede incluir una larga pausa dentro del texto o cambiar la velocidad de habla o el tono. Otras opciones incluyen:

  • enfatizar palabras o frases específicas

  • usar la pronunciación fonética

  • incluir sonidos de respiración

  • susurrar

  • usar el estilo de habla Newscaster.

Para obtener información completa sobre las etiquetas SSML admitidas por Amazon Polly y cómo utilizarlas, consulte Etiquetas SSML compatibles

Cuando se utiliza SSML, existen varios caracteres reservados que requieren un tratamiento especial. Esto se debe a que SSML utiliza estos caracteres como parte de su código. Para utilizarlos, debe usar una entidad específica para aplicarles caracteres de escape. Para obtener más información, consulte Caracteres reservados en SSML.

Amazon Polly proporciona estos tipos de control con un subconjunto de etiquetas de marcado SSML, tal y como se especifica en la recomendación de W3C sobre idioma de marcado de síntesis de voz (SSML) versión 1.1.

Puede utilizar SSML en la consola de Amazon Polly o mediante la AWS CLI. En los siguientes temas se indica cómo puede utilizar SSML para generar fragmentos hablados y controlar la salida con precisión para que se adapte a sus necesidades.