Administración de la carga de trabajo
En esta sección se describe la administración de cargas de trabajo (WLM), que lo ayuda a entender cómo Amazon Redshift prepara y ejecuta las consultas.
La administración de la carga de trabajo (WLM) de Amazon Redshift permite las prioridades flexibles dentro de las cargas de trabajo, por lo que las consultas cortas y de ejecución rápida no quedarán bloqueadas en las colas detrás de las consultas de ejecución prolongada. Amazon Redshift crea colas de consultas en tiempo de ejecución en función de las clases de servicios, que definen los parámetros de configuración de diferentes tipos de colas, incluidas las colas del sistema interno y las colas accesibles por el usuario. Desde una perspectiva de usuario, una clase de servicios accesibles para el usuario y una cola son funcionalmente equivalentes. Por motivos de coherencia, esta documentación usa el término cola para referirse tanto a la clase de servicios accesibles por el usuario como a la cola en tiempo de ejecución.
Redshift ofrece una administración automática de las cargas de trabajo, denominada WLM automática, que está ajustada para manejar cargas de trabajo variables y es la recomendada de forma predeterminada. Con la WLM automática, Redshift determina la utilización de los recursos a medida que llegan las consultas y determina dinámicamente si debe ejecutarlas en el clúster principal, en un clúster de escalado de simultaneidad o enviar cada una a una cola. (Cuando las consultas están en cola, la WLM automática prioriza las consultas de menor duración). La WLM automática maximiza el rendimiento total para que usted pueda mantener recursos de almacenamiento de datos eficientes. Usted ejecuta cargas de trabajo sin tener que preocuparse por su tamaño ni por la forma de programarlas. La WLM automática es la predeterminada para los clústeres aprovisionados. Para obtener más información, consulte Implementación de WLM automática.
nota
Los grupos de trabajo de Amazon Redshift sin servidor utilizan siempre WLM automática.
Cuando se ejecutan muchas consultas o consultas que consumen muchos recursos, la administración de cargas de trabajo puede escalar a recursos de computación adicionales cuando las cargas de trabajo se ponen en cola en los recursos locales. El escalado de simultaneidad con WLM automática admite un rendimiento coherente para un número casi ilimitado de usuarios y consultas simultáneas.
Los clústeres aprovisionados de Redshift ofrecen WLM manual si necesita una optimización manual detallada. Aquí, el cliente administra la asignación de recursos, la simultaneidad de las consultas y las colas. Cuando se ejecuta una consulta, WLM la asigna a una cola según el grupo de usuarios del usuario o por coincidencia con un grupo de consulta que figure en la configuración de la cola. Esto se configura con una etiqueta de grupo de consulta que establece el usuario. Para obtener más información, consulte Implementación de WLM manual.
Aunque la WLM manual puede ajustarse con el tiempo para coincidir con sus patrones de carga de trabajo, en la mayoría de los casos desaconsejamos utilizarla porque su naturaleza estática puede dificultarle la adaptación a las cargas de trabajo cambiantes a lo largo de un día o de un periodo prolongado. Requiere un mayor monitoreo y un ajuste continuo. Además, en muchos casos la WLM manual no utiliza los recursos de computación con la misma eficacia que la WLM automática, por ejemplo, si las colas se establecen manualmente para limitar la memoria que se les asigna.
Una métrica importante para medir el éxito de la configuración de la administración de la carga de trabajo es el rendimiento del sistema, es decir, cuántas consultas se completan correctamente. El rendimiento del sistema se mide en consultas por segundo. Para obtener más información sobre las métricas del sistema, consulte Monitoreo del rendimiento del clúster de Amazon Redshift.
La forma más sencilla de administrar la configuración de WLM es mediante la consola de administración de Amazon Redshift. También puede utilizar la interfaz de la línea de comandos (CLI) de Amazon Redshift o la API de Amazon Redshift. Para obtener más información acerca de cómo implementar y utilizar la administración de la carga de trabajo, consulte Implementación de la administración de la carga de trabajo.