Clasificación del diseño de datos multidimensional (versión preliminar)
La siguiente es una versión preliminar de la documentación sobre la clasificación del diseño de datos multidimensional de tablas. Tanto la documentación como la característica quedan sujetas a cambios. Se recomienda utilizar esta característica solo con clústeres de prueba y no en entornos de producción. Para obtener una vista previa de los términos y las condiciones, consulte Participación de la versión beta del servicio en Términos del servicio de AWS |
nota
Esta característica solo está disponible en la versión preliminar de los clústeres o los grupos de trabajo. Para crear un clúster de versión preliminar, consulte Crear un clúster de versión preliminar en la Guía de administración de Amazon Redshift. Para crear un grupo de trabajo de versión preliminar, consulte Crear un grupo de trabajo de vista previa en la Guía de administración de Amazon Redshift.
Una clave de clasificación de diseño de datos multidimensional es un tipo de clave de clasificación AUTO que se basa en predicados repetitivos encontrados en una carga de trabajo. Si su carga de trabajo tiene predicados repetitivos, Amazon Redshift puede mejorar el rendimiento del escaneo de tablas mediante la colocación de filas de datos que satisfagan los predicados repetitivos. En lugar de almacenar los datos de una tabla siguiendo un estricto orden de columnas, una clave de clasificación de diseño de datos multidimensional almacena los datos mediante el análisis de los predicados repetitivos que aparecen en una carga de trabajo. Se puede encontrar más de un predicado repetitivo en una carga de trabajo. Según la carga de trabajo, este tipo de clave de clasificación puede mejorar el rendimiento de muchos predicados. Amazon Redshift determina automáticamente si este método de clave de clasificación debe utilizarse para las tablas definidas con una clave de clasificación AUTO
.
Por ejemplo, supongamos que tiene una tabla con los datos clasificados en orden de columna. Es posible que sea necesario examinar muchos bloques de datos para determinar si satisfacen los predicados de la carga de trabajo. Sin embargo, si los datos se almacenan en el disco siguiendo un orden de predicados, será necesario escanear menos bloques para satisfacer la consulta. En este caso, usar una clave de clasificación de diseño de datos multidimensional es beneficioso.
Para ver si una consulta utiliza una clave de diseño de datos multidimensional, consulte la columna step_attribute
de la vista SYS_QUERY_DETAIL. Si el valor es multi-dimensional
, entonces se habrá utilizado un diseño de datos multidimensional para la consulta. Para ver si una tabla definida con la clave de clasificación AUTO usa un diseño de datos multidimensional, consulte la columna sortkey1
de la vista SVV_TABLE_INFO. Si el valor es padb_internal_mddl_key_col
, entonces se habrá utilizado un diseño de datos multidimensional para la clave de clasificación de la tabla.
Para evitar que Amazon Redshift utilice una clave de clasificación de diseño de datos multidimensional, elija una opción de clave de clasificación de tablas distinta de SORTKEY AUTO
. Para obtener más información acerca de las opciones SORTKEY, consulte CREATE TABLE.