Optimización de las consultas con indexación y filtrado de particiones de AWS Glue
Cuando Athena consulta las tablas divididas, recupera y filtra las particiones de tabla disponibles en el subconjunto relevante para la consulta. A medida que se agregan nuevos datos y particiones, se necesita más tiempo para procesar las particiones y el tiempo de ejecución de consulta puede aumentar. Si tiene una tabla con un gran número de particiones que crece con el tiempo, considere la posibilidad de utilizar indexación y filtrado de particiones de AWS Glue. La indexación de particiones permite a Athena optimizar el procesamiento de particiones y mejorar el rendimiento de las consultas en tablas altamente particionadas. La configuración del filtrado de particiones en las propiedades de una tabla es un proceso de dos pasos:
-
Creación de un índice de particiones en AWS Glue.
-
Habilitación del filtrado de particiones para la tabla.
Creación de un índice de particiones
A fin de conocer los pasos para crear un índice de particiones en AWS Glue, consulte Trabajar con índices de partición en la Guía para desarrolladores de AWS Glue. Para conocer las limitaciones de los índices de particiones en AWS Glue, consulte Acerca de los índices de particiones de esa página.
Habilitación del filtrado de particiones
A fin de habilitar el filtrado de particiones para la tabla, debe configurar una nueva propiedad de tabla en AWS Glue. Para conocer los pasos sobre cómo configurar las propiedades de la tabla en AWS Glue, consulte la página Configuración de proyección de particiones. Cuando edita los detalles de la tabla en AWS Glue, agregue el siguiente valor de clave a la sección Table properties (Propiedades de la tabla):
-
En Key (Clave), agregue
partition_filtering.enabled
. -
En Value (Valor), agregue
true
.
Para desactivar el filtrado de particiones en esta tabla en cualquier momento, configure el valor partition_filtering.enabled
como false
.
Después de completar los pasos anteriores, puede volver a la consola de Athena para consultar los datos.
Para obtener más información sobre la creación de índices y filtros de particiones, consulte el artículo Mejora del rendimiento de consultas de Amazon Athena con índices de particiones de AWS Glue Data Catalog