Optimisez les requêtes grâce à l'indexation et au filtrage des AWS Glue partitions - Amazon Athena

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Optimisez les requêtes grâce à l'indexation et au filtrage des AWS Glue partitions

Lors de l'interrogation de tables partitionnées, Athena récupère et filtre les partitions de table disponibles vers le sous-ensemble correspondant à votre requête. À mesure que de nouvelles données et partitions sont ajoutées, il faut plus de temps pour traiter les partitions et l'exécution des requêtes peut augmenter. Si vous disposez d'une table avec un grand nombre de partitions qui croît au fil du temps, envisagez d'utiliser indexation et filtrage des partitions AWS Glue . L'indexation des partitions permet à Athena d'optimiser le traitement des partitions et d'améliorer les performances des requêtes sur les tables fortement partitionnées. La configuration du filtrage de partition dans les propriétés d'une table s'effectue en deux étapes :

  1. Création d'un index de partition dans AWS Glue.

  2. Activation du filtrage des partitions pour la table.

Création d'un index de partition

Pour connaître les étapes de création d'un index de partition dans AWS Glue, consultez la section Utilisation des index de partition dans le Guide du AWS Glue développeur. Pour connaître les limites relatives aux index de partition dans AWS Glue, consultez la section À propos des index de partition de cette page.

Activation du filtrage de partition

Pour activer le filtrage des partitions pour la table, vous devez définir une nouvelle propriété de table dans AWS Glue. Pour savoir comment définir les propriétés d'une table dans AWS Glue, reportez-vous à la page Configuration de la projection par partition. Lorsque vous modifiez les détails de la table dans AWS Glue, ajoutez la paire clé-valeur suivante à la section Propriétés de la table :

  • Pour Key (Clé), ajoutez partition_filtering.enabled

  • Pour Value (Valeur), ajoutez true

Vous pouvez désactiver le filtrage de partition sur cette table à tout moment en définissant la valeur partition_filtering.enabled sur false.

Une fois que vous avez terminé les étapes ci-dessus, vous pouvez revenir à la console Athena pour interroger les données.

Pour plus d'informations sur l'utilisation de l'indexation et du filtrage des partitions, consultez la section Améliorer les performances des requêtes Amazon Athena à AWS Glue Data Catalog l'aide d'index de partition sur AWS le blog Big Data.