Generación de estadísticas de las columnas de las tablas de Iceberg - AWS Glue

Generación de estadísticas de las columnas de las tablas de Iceberg

Siga estos pasos para configurar un cronograma para generar estadísticas en el catálogo de datos mediante la AWS Glue consola AWS CLI o ejecutar la StartColumnStatisticsTaskRunoperación.

Generación de estadísticas de columnas
  1. Inicie sesión en la AWS Glue consola en https://console.aws.amazon.com/glue/.

  2. Seleccione Tablas en el Catálogo de datos.

  3. Seleccione una tabla de Iceberg de la lista.

  4. Seleccione Generar estadísticas, Generar bajo demanda en el menú Acciones.

    También puede pulsar el botón Generar estadísticas en la pestaña Estadísticas de columnas, en la sección inferior de la página de Tablas.

  5. En la página Generar estadísticas, proporcione los detalles de generación de estadísticas. Siga los pasos 6 a 11 de la Generación de estadísticas de columnas según un cronograma sección para configurar un cronograma de generación de estadísticas para las tablas Iceberg.

    También puede optar por generar estadísticas de columnas a pedido siguiendo las instrucciones de la Generación de estadísticas de columnas a pedido

    nota

    La opción de muestreo no está disponible para las tablas de Iceberg.

    AWS Glue calcula el número de valores distintos de cada columna de la tabla Iceberg en un nuevo archivo Puffin asignado al ID de instantánea especificado en su ubicación de Amazon S3.