Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Puoi utilizzare la AWS Glue console o l' AWS API per abilitare la compattazione delle tabelle Apache Iceberg nel Data Catalog. AWS CLI AWS Glue Per le nuove tabelle, puoi scegliere Apache Iceberg come formato di tabella e abilitare la compattazione quando crei la tabella. La compattazione è disabilitata per impostazione predefinita per le nuove tabelle.
Per abilitare la compattazione
-
Apri la AWS Glue console all'indirizzo https://console.aws.amazon.com/glue/
e accedi come amministratore del data lake, creatore della tabella o utente a cui sono state concesse lakeformation:GetDataAccess
le autorizzazioniglue:UpdateTable
e sulla tabella. -
Nel pannello di navigazione, in Catalogo dati, seleziona Tabelle.
Nella pagina Tabelle, scegli una tabella in formato tabella aperta per la quale desideri abilitare la compattazione, quindi nel menu Azioni, scegli Ottimizzazione e quindi scegli Abilita.
È inoltre possibile abilitare la compattazione selezionando la scheda Ottimizzazione della tabella nella pagina dei dettagli della tabella. Scegli la scheda Ottimizzazione della tabella nella sezione inferiore della pagina e scegli Abilita compattazione.
L'opzione Abilita ottimizzazione è disponibile anche quando si crea una nuova tabella Iceberg nel Data Catalog.
-
Nella pagina Abilita ottimizzazione, scegli Compattazione in Opzioni di ottimizzazione.
-
Quindi, seleziona un ruolo IAM dal menu a discesa con le autorizzazioni mostrate nella sezione. Prerequisiti per l'ottimizzazione delle tabelle
Puoi anche scegliere l'opzione Crea un nuovo ruolo IAM per creare un ruolo personalizzato con le autorizzazioni necessarie per eseguire la compattazione.
Segui la procedura riportata di seguito per aggiornare un ruolo IAM esistente:
-
Per aggiornare la politica di autorizzazione per il ruolo IAM, nella console IAM, vai al ruolo IAM utilizzato per eseguire la compattazione.
-
Nella sezione Aggiungi autorizzazioni, scegli Crea policy. Nella finestra del browser appena aperta, crea una nuova policy da utilizzare con il tuo ruolo.
-
Nella pagina Crea politica, scegli la
JSON
scheda. Copia il codice JSON mostrato nel campo Prerequisiti nel campo dell'editor delle politiche.
-
-
Se hai configurazioni di policy di sicurezza in cui l'ottimizzatore di tabelle Iceberg deve accedere ai bucket Amazon S3 da uno specifico Virtual Private Cloud (VPC), crea una connessione di rete o usane una esistente. AWS Glue
Se non hai già configurato una connessione AWS Glue VPC, creane una nuova seguendo i passaggi nella sezione Creazione di connessioni per connettori utilizzando la AWS Glue console o /SDK. AWS CLI
-
Scegli Abilita ottimizzazione.
Dopo aver abilitato la compattazione, la scheda di Ottimizzazione della tabella mostra i seguenti dettagli di compattazione, dopo circa 15-20 minuti:
- Ora di inizio
-
L'ora in cui è iniziato il processo di compattazione in Data Catalog. Il valore è un timestamp in formato UTC.
- Ora di fine
-
L'ora in cui il processo di compattazione è terminato in Data Catalog. Il valore è un timestamp in formato UTC.
- Stato
-
Lo stato del ciclo di compattazione. I valori sono esito positivo o negativo.
- File compattati
Numero totale di file compattati.
- Byte compattati
-
Numero totale di byte compattati.