OPTIMIZE - Amazon Athena

OPTIMIZE

Optimiza las filas de una tabla de Apache Iceberg al reescribir los archivos de datos en un diseño más optimizado en función de su tamaño y del número de archivos de eliminación asociados.

nota

OPTIMIZE es transaccional y solo se admite en tablas de Apache Iceberg.

Sintaxis

En el siguiente resumen de sintaxis, se muestra cómo optimizar el diseño de datos de una tabla de Iceberg.

OPTIMIZE [db_name.]table_name REWRITE DATA USING BIN_PACK [WHERE predicate]
nota

Solo se permiten columnas de partición en el predicado de la cláusula WHERE. Si se especifica una columna que no es de partición, se producirá un error en la consulta.

La acción de compactación se cobra por la cantidad de datos analizados durante el proceso de reescritura. La acción REWRITE DATA usa predicados para seleccionar los archivos que contienen filas que coinciden. Si alguna fila del archivo coincide con el predicado, el archivo se selecciona para la optimización. Así, para controlar el número de archivos afectados por la operación de compactación, puede especificar una cláusula WHERE.

Configuración de las propiedades de compactación

Para controlar el tamaño de los archivos que se seleccionarán para la compactación y el tamaño de archivo resultante después de la compactación, puede usar parámetros de propiedades de tabla. Puede utilizar el comando ALTER TABLE SET PROPERTIES para configurar las siguientes propiedades de la tabla relacionadas.

Recursos adicionales de

Optimización de las tablas de Iceberg