Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Tabelle S3 consente di usufruire di operazioni di manutenzione in grado di migliorare la gestione e le prestazioni della tabella. Le seguenti opzioni sono attivate per impostazione predefinita per tutte le tabelle. È possibile modificarle o disattivarle specificando i file di configurazione della manutenzione per la tabella S3.
Per modificare questa configurazione sono necessarie le autorizzazioni s3tables:GetTableMaintenanceConfiguration
e s3tables:PutTableMaintenanceConfiguration
.
Compattazione
La compattazione combina oggetti più piccoli in un numero inferiore di oggetti più grandi per migliorare le prestazioni delle query di Iceberg. Oltre a combinare oggetti, la compattazione applica anche gli effetti delle eliminazioni a livello di riga alla tabella. Amazon S3 compatta le tabelle in base a una dimensione del file di destinazione ottimale per il modello di accesso ai dati o a un valore specificato. I file compattati vengono scritti come la snapshot più recente della tabella. La compattazione è attivata per impostazione predefinita per tutte le tabelle, con una dimensione del file di destinazione predefinita di 512 MB.
Nota
La compattazione è supportata solo su Apache Parquet tipi di file.
La compattazione può essere configurata solo a livello di tabella. e comporta un costo aggiuntivo. Per ulteriori informazioni, consulta i prezzi in Prezzi di Amazon S3
- Per configurare la dimensione del file di destinazione della compattazione utilizzando AWS CLI
-
Il seguente esempio cambierà la dimensione del file di destinazione in 256 MB utilizzando l'API
PutTableMaintenanceConfiguration
.aws s3tables put-table-maintenance-configuration \ --table-bucket-arn arn:aws:s3tables:
us-east-1
:111122223333
:bucket/amzn-s3-demo-bucket1
\ --type icebergCompaction \ --namespacemynamespace
\ --nametesttable
\ --value='{"status":"enabled","settings":{"icebergCompaction":{"targetFileSizeMB":256}}}'Per ulteriori informazioni, consulta put-table-maintenance-configuration
nel AWS CLI Command Reference. - Per disabilitare la compattazione utilizzando il AWS CLI
-
Il seguente esempio disattiverà la compattazione utilizzando l'API
PutTableMaintenanceConfiguration
.aws s3tables put-table-maintenance-configuration \ --table-bucket-arn arn:aws:s3tables:
us-east-1
:111122223333
:bucket/amzn-s3-demo-table-bucket \ --type icebergCompaction \ --namespacemynamespace
\ --nametesttable
\ --value='{"status":"disabled","settings":{"icebergCompaction":{"targetFileSizeMB":256}}}'Per ulteriori informazioni, consulta put-table-maintenance-configuration
nel AWS CLI Command Reference.
Gestione degli snapshot
La gestione degli snapshot determina il numero di snapshot attivi per la tabella. Si basa su MinimumSnapshots
(1 per impostazione predefinita) e MaximumSnapshotAge
(120 ore per impostazione predefinita). La gestione degli snapshot scade e rimuove gli snapshot delle tabelle in base a queste configurazioni.
Quando uno snapshot scade, Amazon S3 contrassegna come non correnti tutti gli oggetti a cui fa riferimento tale snapshot. Tali oggetti non correnti vengono eliminati dopo il numero di giorni specificato dalla proprietà NoncurrentDays
nella policy di rimozione dei file senza riferimenti.
Nota
L'eliminazione di oggetti non correnti è permanente, pertanto gli oggetti non possono essere recuperati.
Per visualizzare o recuperare oggetti contrassegnati come non correnti, è necessario contattare Supporto AWS. Per informazioni su come contattare Supporto AWS, vedere Contatti AWS
La gestione degli snapshot determina gli oggetti da eliminare dalla tabella che fanno riferimento solo a tale tabella. Qualsiasi riferimento fatto a questi oggetti all'esterno della tabella non impedirà alla gestione degli snapshot di eliminare un oggetto.
Nota
La gestione degli snapshot non supporta i valori di conservazione configurati come proprietà della tabella Iceberg nel file metadata.json
o tramite un comando SQL ALTER TABLE SET TBLPROPERTIES
, inclusa la conservazione basata su ramo o tag. La gestione degli snapshot viene disattivata quando si configura una policy di conservazione basata su ramo o tag oppure quando si configura una policy di conservazione sul file metadata.json
più lunga dei valori configurati tramite l'API PutTableMaintenanceConfiguration
. In questi casi S3 non scadrà né rimuoverà gli snapshot e sarà necessario eliminare manualmente gli snapshot o rimuovere le proprietà dalla tabella Iceberg per evitare costi di archiviazione.
È possibile configurare la gestione degli snapshot solo a livello di tabella. Per ulteriori informazioni, consulta i prezzi in Prezzi di Amazon S3
- Per configurare la gestione delle istantanee utilizzando AWS CLI
-
Il seguente esempio imposterà
MinimumSnapshots
su 10 eMaximumSnapshotAge
su 2.500 ore utilizzando l'APIPutTableMaintenanceConfiguration
.aws s3tables put-table-maintenance-configuration \ --table-bucket-arn arn:aws:s3tables:
us-east-1
:111122223333
:bucket/amzn-s3-demo-table-bucket \ --namespacemy_namespace
\ --namemy_table
\ --type icebergSnapshotManagement \ --value '{"status":"enabled","settings":{"icebergSnapshotManagement":{"minSnapshotsToKeep":10,"maxSnapshotAgeHours":2500}}}'
Per ulteriori informazioni, consulta put-table-maintenance-configuration
Considerazioni e limitazioni
Per ulteriori informazioni su considerazioni e limitazioni aggiuntive relative alla compattazione e alla gestione degli snapshot, consulta Considerazioni e limitazioni per i processi di manutenzione.