Generazione di indici di partizione - AWS Glue

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Generazione di indici di partizione

Il Data Catalog supporta la creazione di indici di partizione per fornire una ricerca efficiente di partizioni specifiche. Per ulteriori informazioni, vedere Creazione di indici di partizione. Per impostazione predefinita, il AWS Glue crawler crea indici di partizione per le destinazioni Amazon S3 e Delta Lake.

AWS Management Console
  1. Accedi a e apri la console all'indirizzo. AWS Management Console AWS Glue https://console.aws.amazon.com/glue/

  2. Scegli Crawler nel Data Catalog.

  3. Quando definisci un crawler, l'opzione Crea automaticamente gli indici delle partizioni è abilitata per impostazione predefinita in Opzioni avanzate nella pagina Imposta output e pianificazione.

    Per disabilitare questa opzione, puoi deselezionare la casella di controllo Crea automaticamente gli indici delle partizioni nella console.

  4. Completa la configurazione del crawler e scegli Crea crawler.

AWS CLI

Puoi anche disabilitare questa opzione utilizzando il parametro AWS CLI, set the nelCreatePartitionIndex . configuration Il valore di default è true.

aws glue update-crawler \ --name myCrawler \ --configuration '{"Version": 1.0, "CreatePartitionIndex": false }'

Note di utilizzo sugli indici di partizione

  • Le tabelle create dal crawler non hanno la variabile partition_filtering.enabled per impostazione predefinita. Per ulteriori informazioni, consulta la pagina AWS Glue partition indexing and filtering.

  • La creazione di indici di partizione per partizioni crittografate non è supportata.