Attivazione dell'ottimizzatore della compattazione - AWS Aderenza

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Attivazione dell'ottimizzatore della compattazione

È possibile utilizzare… AWS Glue console, AWS CLI, oppure AWS APIper abilitare la compattazione delle tabelle Apache Iceberg nel AWS Glue Catalogo dati. Per le nuove tabelle, puoi scegliere Apache Iceberg come formato di tabella e abilitare la compattazione quando crei la tabella. La compattazione è disabilitata per impostazione predefinita per le nuove tabelle.

Console
Per abilitare la compattazione
  1. Aprire il AWS Glue console all'indirizzo https://console.aws.amazon.com/glue/e accedi come amministratore del data lake, creatore della tabella o utente a cui sono state glue:UpdateTable concesse le lakeformation:GetDataAccess autorizzazioni e sulla tabella.

  2. Nel pannello di navigazione, in Catalogo dati, seleziona Tabelle.

  3. Nella pagina Tabelle, scegli una tabella in formato tabella aperta per la quale desideri abilitare la compattazione, quindi nel menu Azioni, scegli Ottimizzazione e quindi scegli Abilita.

    È inoltre possibile abilitare la compattazione selezionando la scheda Ottimizzazione della tabella nella pagina dei dettagli della tabella. Scegli la scheda Ottimizzazione della tabella nella sezione inferiore della pagina e scegli Abilita compattazione.

    L'opzione Abilita ottimizzazione è disponibile anche quando si crea una nuova tabella Iceberg nel Data Catalog.

  4. Nella pagina Abilita ottimizzazione, scegli Compattazione in Opzioni di ottimizzazione.

    Pagina dei dettagli della tabella Apache Iceberg con l'opzione Abilita compattazione.
  5. Quindi, seleziona un IAM ruolo dal menu a discesa con le autorizzazioni mostrate nella sezione. Prerequisiti per l'ottimizzazione delle tabelle

    Puoi anche scegliere l'opzione Crea un nuovo IAM ruolo per creare un ruolo personalizzato con le autorizzazioni necessarie per eseguire la compattazione.

    Segui i passaggi seguenti per aggiornare un ruolo esistenteIAM:

    1. Per aggiornare la politica delle autorizzazioni per il IAM ruolo, nella IAM console, vai al IAM ruolo utilizzato per eseguire la compattazione.

    2. Nella sezione Aggiungi autorizzazioni, scegli Crea politica. Nella finestra del browser appena aperta, crea una nuova policy da utilizzare con il tuo ruolo.

    3. Nella pagina Crea politica, scegli la JSON scheda. Copia il JSON codice mostrato nel campo Prerequisiti nel campo dell'editor delle politiche.

  6. Scegli Abilita ottimizzazione.

AWS CLI

L'esempio seguente mostra come abilitare la compattazione. Sostituisci l'ID dell'account con un ID valido AWS ID dell'account. Sostituisci il nome del database e della tabella con quello effettivo della tabella Iceberg e del database. Sostituire il roleArn con AWS Nome della risorsa (ARN) del IAM ruolo e nome del IAM ruolo che dispone delle autorizzazioni necessarie per eseguire la compattazione.

aws glue create-table-optimizer \ --catalog-id 123456789012 \ --database-name iceberg_db \ --table-name iceberg_table \ --table-optimizer-configuration '{"roleArn":"arn:aws:iam::123456789012:role/optimizer_role", "enabled":'true'}' \ --type compaction
AWS API

Chiama l'operazione CreateTableOptimizer per abilitare la compattazione di una tabella.

Dopo aver abilitato la compattazione, la scheda di Ottimizzazione della tabella mostra i seguenti dettagli di compattazione, dopo circa 15-20 minuti:

Ora di inizio

L'ora in cui è iniziato il processo di compattazione in Data Catalog. Il valore è un timestamp nel tempo. UTC

Ora di fine

L'ora in cui il processo di compattazione è terminato in Data Catalog. Il valore è un timestamp nel tempo. UTC

Stato

Lo stato della corsa di compattazione. I valori sono esito positivo o negativo.

File compattati

Numero totale di file compattati.

Byte compattati

Numero totale di byte compattati.