OPTIMIZE
Optimiza las filas de una tabla de Apache Iceberg al reescribir los archivos de datos en un diseño más optimizado en función de su tamaño y del número de archivos de eliminación asociados.
nota
OPTIMIZE
es transaccional y solo se admite en tablas de Apache Iceberg.
Sintaxis
En el siguiente resumen de sintaxis, se muestra cómo optimizar el diseño de datos de una tabla de Iceberg.
OPTIMIZE [
db_name
.]table_name
REWRITE DATA USING BIN_PACK [WHEREpredicate
]
nota
Solo se permiten columnas de partición en el predicado
de la cláusula WHERE
. Si se especifica una columna que no es de partición, se producirá un error en la consulta.
La acción de compactación se cobra por la cantidad de datos analizados durante el proceso de reescritura. La acción REWRITE DATA
usa predicados para seleccionar los archivos que contienen filas que coinciden. Si alguna fila del archivo coincide con el predicado, el archivo se selecciona para la optimización. Así, para controlar el número de archivos afectados por la operación de compactación, puede especificar una cláusula WHERE
.
Configuración de las propiedades de compactación
Para controlar el tamaño de los archivos que se seleccionarán para la compactación y el tamaño de archivo resultante después de la compactación, puede usar parámetros de propiedades de tabla. Puede utilizar el comando ALTER TABLE SET TBLPROPERTIES para configurar las siguientes propiedades de la tabla relacionadas.
Recursos adicionales de
Optimización de las tablas de Iceberg