Generación de índices de particiones - AWS Glue

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Generación de índices de particiones

El Catálogo de datos es compatible con la creación de índices de particiones para ofrecer una búsqueda eficiente de particiones específicas. Para obtener más información, consulte Creación de índices de partición. El rastreador de AWS Glue crea, de manera predeterminada, índices de particiones para los destinos de Amazon S3 y Delta Lake.

AWS Management Console
  1. Inicie sesión en la AWS Management Console y abra la consola de AWS Glue en https://console.aws.amazon.com/glue/.

  2. Elija Rastreadores en el Catálogo de datos.

  3. Cuando se define un rastreador, la opción para Crear índices de partición de manera automática se habilita de manera predeterminada en la sección Opciones avanzadas en la página Establecer salida y programación.

    Para desactivar esta opción, puede anular la selección de la casilla Crear índices de particiones de manera automática en la consola.

  4. Complete la configuración del rastreador y elija Crear rastreador.

AWS CLI

También puede desactivarla mediante la AWS CLI, establezca CreatePartitionIndex en el parámetro configuration. El valor predeterminado es true.

aws glue update-crawler \ --name myCrawler \ --configuration '{"Version": 1.0, "CreatePartitionIndex": false }'

Notas de uso de índices de particiones

  • Las tablas creadas por el rastreador no tienen la variable de forma partition_filtering.enabled predeterminada. Para obtener más información, consulte Índices de partición y filtros de AWS Glue.

  • La creación de índices de partición para particiones cifradas no es compatible.