Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Optimieren Sie Iceberg-Tabellen
Wenn sich Daten in einer Iceberg-Tabelle ansammeln, werden Abfragen aufgrund der erhöhten Bearbeitungszeit, die zum Öffnen von Dateien erforderlich ist, allmählich weniger effizient. Zusätzliche Rechenkosten fallen an, wenn die Tabelle Dateien löschen
Um die Leistung von Abfragen auf Iceberg-Tabellen zu optimieren, unterstützt Athena die manuelle Verdichtung als Tabellenwartungsbefehl. Verdichtungen optimieren das strukturelle Layout der Tabelle, ohne den Tabelleninhalt zu ändern.
OPTIMIZE
Die OPTIMIZE
-Verdichtungsaktion schreibt Datendateien basierend auf ihrer Größe und Anzahl der zugehörigen Löschdateien in ein optimierteres Layout um. Einzelheiten zur Syntax und Tabelleneigenschaften finden Sie unter OPTIMIZE.table
REWRITE DATA
Beispiel
Im folgenden Beispiel werden Löschdateien in Datendateien zusammengeführt und Dateien in der Nähe der Zieldateigröße erstellt, bei denen der Wert von category
c1
ist.
OPTIMIZE iceberg_table REWRITE DATA USING BIN_PACK WHERE category = 'c1'
VACUUM
VACUUM
führt den Snapshot-Ablauf
Beispiel
Im folgenden Beispiel wird eine Tabelleneigenschaft verwendet, um die Tabelle iceberg_table
so zu konfigurieren, dass die Daten der letzten drei Tage beibehalten werden. Anschließend verwendet es VACUUM
, um die alten Snapshots ablaufen zu lassen und die verwaisten Dateien aus der Tabelle zu entfernen.
ALTER TABLE iceberg_table SET TBLPROPERTIES ( 'vacuum_max_snapshot_age_seconds'='259200' ) VACUUM iceberg_table