Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Archivo de audio largos

Modo de enfoque
Archivo de audio largos - Amazon Polly

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Para crear archivos TTS para fragmentos de texto grandes, utilice la funcionalidad síntesis asíncrona de Amazon Polly. Esto usa los tres SpeechSynthesisTask APIs:

  • StartSpeechSynthesisTask: inicia una tarea de síntesis nueva.

  • GetSpeechSynthesisTask: devuelve detalles acerca de una tarea de síntesis enviada con anterioridad.

  • ListSpeechSynthesisTasks: enumera todas las tareas de síntesis enviadas.

La operación SynthesizeSpeech produce audio casi en tiempo real, con relativamente poca latencia en la mayoría de los casos. Para ello, la operación solo puede sintetizar 3000 caracteres.

La característica de síntesis asíncrona de Amazon Polly supera el desafío que supone el procesamiento de un documento de texto de mayor tamaño cambiando la manera en la que el documento se sintetiza y se devuelve. Cuando se realiza una solicitud de síntesis enviando texto de entrada con StartSpeechSynthesisTask, Amazon Polly pone en cola las solicitudes y, a continuación, las procesa de forma asíncrona en segundo plano tan pronto como el sistema cuenta con recursos disponibles. Amazon Polly carga a continuación el flujo de voz o de marcas de voz resultante directamente a su bucket de Amazon Simple Storage Service (Amazon S3) (obligatorio) y le informa acerca de la disponibilidad del archivo completado a través de su tema de SNS (opcional).

De esta forma, toda la funcionalidad, excepto el procesamiento casi en tiempo real está disponible para textos de hasta 100 000 caracteres facturables (o 200 000 caracteres totales) de longitud.

Para sintetizar un documento mediante este método, debe disponer de un bucket de Amazon S3 en el que pueda escribir donde pueda guardar el archivo de audio. Puede recibir una notificación cada vez que la síntesis de audio esté lista proporcionando un identificador de tema de SNS opcional. Cuando la tarea de síntesis se haya completado, Amazon Polly publicará un mensaje sobre ese tema. Este mensaje también podría contener información de errores útil en aquellos casos en los que la tarea de síntesis no se realice correctamente. Para ello, asegúrese de que el usuario que crea la tarea de síntesis pueda publicar también en el tema de SNS. Consulte la documentación de Amazon SNS para obtener más información acerca de cómo crear y suscribirse a un tema de SNS.

Cifrado

Puede almacenar el archivo de salida en formato cifrado en el bucket de S3 si lo desea. Para ello, habilite cifrado de bucket de Amazon S3, que utiliza uno de los cifrados de bloques más seguros disponibles Advanced Encryption Standard de 256 bits (AES-256).

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.