OPTIMIZE - Amazon Athena

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

OPTIMIZE

Optimiert Zeilen in einer Apache-Iceberg-Tabelle durch Umschreiben von Datendateien in ein optimiertes Layout basierend auf deren Größe und der Anzahl der zugeordneten Löschdateien.

Anmerkung

OPTIMIZE ist transaktionsbasiert und wird nur für Apache-Iceberg-Tabellen unterstützt.

Syntax

Die folgende Syntaxzusammenfassung zeigt, wie das Datenlayout für eine Iceberg-Tabelle optimiert wird.

OPTIMIZE [db_name.]table_name REWRITE DATA USING BIN_PACK [WHERE predicate]
Anmerkung

Im WHERE Klauselprädikat sind nur Partitionsspalten zulässig. Wenn Sie eine Spalte angeben, die nicht partitioniert ist, schlägt die Abfrage fehl.

Die Verdichtungsaktion wird durch die Datenmenge berechnet, die während des Umschreibungsvorgangs gescannt wurde. Die REWRITE DATA-Aktion verwendet Prädikate zur Auswahl für Dateien, die übereinstimmende Zeilen enthalten. Wenn eine Zeile in der Datei mit dem Prädikat übereinstimmt, wird die Datei zur Optimierung ausgewählt. Um also die Anzahl der von der Verdichtungsoperation betroffenen Dateien zu steuern, können Sie eine WHERE-Klausel angeben.

Konfigurieren von Komprimierungs-Eigenschaften

Um die Größe der für die Verdichtung zu wählenden Dateien und die resultierende Dateigröße nach der Verdichtung zu steuern, können Sie Tabelleneigenschaftsparameter verwenden. Sie können den FESTGELEGTE TABELLENEIGENSCHAFTEN ÄNDERN-Befehl verwenden, um die zugehörigen Tabelleneigenschaften zu konfigurieren.

Weitere Ressourcen

Optimieren von Iceberg-Tabellen