Génération d'index de partition - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Génération d'index de partition

Le catalogue de données prend en charge la création d'index de partition afin de permettre une recherche efficace de partitions spécifiques. Pour plus d'informations, consultez la section Création d'index de partition. Le AWS Glue crawler crée des index de partition pour les cibles Amazon S3 et Delta Lake par défaut.

AWS Management Console
  1. Connectez-vous à la AWS Glue console AWS Management Console et ouvrez-la à l'adresse https://console.aws.amazon.com/glue/.

  2. Choisissez Crawlers dans le catalogue de données.

  3. Lorsque vous définissez un robot d'exploration, l'option permettant de créer automatiquement des index de partition est activée par défaut sous Options avancées de la page Définir la sortie et la planification.

    Pour désactiver cette option, vous pouvez décocher la case Créer des index de partition automatiquement dans la console.

  4. Complétez la configuration du robot d'exploration et choisissez Create crawler.

AWS CLI

Vous pouvez également désactiver cette option en utilisant le configuration paramètre AWS CLI, définissez le. CreatePartitionIndex La valeur par défaut est True.

aws glue update-crawler \ --name myCrawler \ --configuration '{"Version": 1.0, "CreatePartitionIndex": false }'

Notes d'utilisation pour les index de partition

  • Les tables créées par le Crawler ne contiennent pas la variable partition_filtering.enabled par défaut. Pour en savoir plus, consultez AWS Glue partition indexing and filtering.

  • La création d'index de partition pour les partitions chiffrées n'est pas prise en charge.