Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Adición de compresión de rango dinámico

Modo de enfoque
Adición de compresión de rango dinámico - Amazon Polly

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

<amazon:effect name="drc">

Esta etiqueta es compatible con los formatos TTS de formato largo, neuronal y estándar.

En función del texto, el idioma y la voz utilizados en un archivo de audio, los sonidos varían desde suaves a altos. Con frecuencia, los sonidos ambientales, como el sonido de un vehículo en movimiento, pueden enmascarar los sonidos más suaves, lo que impide oír con claridad la pista de audio. Para mejorar el volumen de determinados sonidos en el archivo de audio, utilice la etiqueta de compresión de rango dinámico (drc).

La etiqueta drc establece un umbral de "volumen" de rango medio para el audio y aumenta el volumen (la ganancia) de los sonidos alrededor de dicho umbral. El mayor aumento de ganancia se aplica cerca del umbral, y dicho aumento se va reduciendo al alejarse del umbral.

La compresión de rango dinámico aumenta el volumen de los sonidos alrededor de un determinado umbral.

Esto facilita la audición de los sonidos de rango medio en un entorno ruidoso, lo que permite que todo el archivo de audio se oiga con más claridad.

La etiqueta drc es un parámetro booleano (está presente o no lo está). Utiliza la sintaxis: <amazon:effect name="drc"> y se cierra con </amazon:effect>.

Puede utilizar la etiqueta drc con cualquier voz o idioma compatible con Amazon Polly. Puede aplicarla a una sección entera de la grabación o solo a unas pocas palabras. Por ejemplo:

<speak> Some audio is difficult to hear in a moving vehicle, but <amazon:effect name="drc"> this audio is less difficult to hear in a moving vehicle.</amazon:effect> </speak>
nota

Si utiliza "drc" en la sintaxis , esta distingue entre mayúsculas y minúsculas.amazon:effect

Uso de drc con la etiqueta prosody volume

Como muestra el siguiente gráfico, la etiqueta prosody volume aumenta de manera uniforme el volumen de un archivo de audio desde el nivel original (línea discontinua) a un nivel ajustado (línea continua). Para aumentar aún más el volumen de determinadas partes del archivo, utilice la etiqueta drc con la etiqueta prosody volume. La combinación de etiquetas no afecta a la configuración de la etiqueta prosody volume.

El uso de la etiqueta prosody volume aumenta el volumen en todo el archivo de audio.

Cuando se utilizan las etiquetas drc y prosody volume juntas, Amazon Polly aplica primero la etiqueta drc, aumentando los sonidos de rango medio (los que están cerca del umbral). A continuación, aplica la etiqueta prosody volume y aumenta el volumen de toda la pista de audio de manera uniforme.

El uso de la etiqueta drc con una etiqueta prosody volume aumenta el volumen de los sonidos de rango medio además del volumen de toda la pista de audio.

Para utilizar las etiquetas juntas, anide una dentro de la otra. Por ejemplo:

<speak> <prosody volume="loud">This text needs to be understandable and loud. <amazon:effect name="drc"> This text also needs to be more understandable in a moving car.</amazon:effect></prosody> </speak>

En este texto, la etiqueta prosody volume establece el nivel de volumen de todo el pasaje en "loud" (alto). La etiqueta drc mejora el volumen de los valores de rango medio de la segunda frase.

nota

Cuando utilice las etiquetas drc y prosody volume juntas, emplee las prácticas estándar de XML para el anidado de etiquetas.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.