Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
OPTIMIZE
Optimiert Zeilen in einer Apache-Iceberg-Tabelle durch Umschreiben von Datendateien in ein optimiertes Layout basierend auf deren Größe und der Anzahl der zugeordneten Löschdateien.
Anmerkung
OPTIMIZE
ist transaktionsbasiert und wird nur für Apache-Iceberg-Tabellen unterstützt.
Syntax
Die folgende Syntaxzusammenfassung zeigt, wie das Datenlayout für eine Iceberg-Tabelle optimiert wird.
OPTIMIZE [
db_name
.]table_name
REWRITE DATA USING BIN_PACK [WHEREpredicate
]
Anmerkung
Im WHERE
Klauselprädikat
sind nur Partitionsspalten zulässig. Wenn Sie eine Spalte angeben, die nicht partitioniert ist, schlägt die Abfrage fehl.
Die Verdichtungsaktion wird durch die Datenmenge berechnet, die während des Umschreibungsvorgangs gescannt wurde. Die REWRITE DATA
-Aktion verwendet Prädikate zur Auswahl für Dateien, die übereinstimmende Zeilen enthalten. Wenn eine Zeile in der Datei mit dem Prädikat übereinstimmt, wird die Datei zur Optimierung ausgewählt. Um also die Anzahl der von der Verdichtungsoperation betroffenen Dateien zu steuern, können Sie eine WHERE
-Klausel angeben.
Konfigurieren von Komprimierungs-Eigenschaften
Um die Größe der für die Verdichtung zu wählenden Dateien und die resultierende Dateigröße nach der Verdichtung zu steuern, können Sie Tabelleneigenschaftsparameter verwenden. Sie können den ALTER TABLE SET TBLPROPERTIES-Befehl verwenden, um die zugehörigen Tabelleneigenschaften zu konfigurieren.
Weitere Ressourcen
Optimieren Sie Iceberg-Tabellen