Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Generieren von Spaltenstatistiken für Iceberg-Tabellen
Gehen Sie wie folgt vor, um einen Zeitplan für die Generierung von Statistiken im Datenkatalog zu konfigurieren. Verwenden Sie dazu die AWS Glue Konsole AWS CLI oder führen Sie den StartColumnStatisticsTaskRunVorgang aus.
Um Spaltenstatistiken zu generieren
-
Melden Sie sich bei der AWS Glue Konsole an unter https://console.aws.amazon.com/glue/
. -
Wählen Sie unter Datenkatalog die Option Tabellen aus.
-
Wählen Sie eine Iceberg-Tabelle aus der Liste aus.
-
Wählen Sie im Menü Aktionen die Option Spaltenstatistiken, Auf Abruf generieren aus.
Sie können auch im unteren Bereich der Seite Tabellen auf der Registerkarte Spaltenstatistiken die Schaltfläche Statistik generieren auswählen.
-
Geben Sie auf der Seite Statistiken generieren die Details zur Statistikgenerierung an. Folgen Sie den Schritten 6 bis 11 in Generieren von Spaltenstatistiken nach einem Zeitplan diesem Abschnitt, um einen Zeitplan für die Statistikgenerierung für Iceberg-Tabellen zu konfigurieren.
Sie können sich auch dafür entscheiden, Spaltenstatistiken bei Bedarf zu generieren, indem Sie den Anweisungen in der Generierung von Spaltenstatistiken auf Abruf
Anmerkung
Die Sampling-Option ist für Iceberg-Tabellen nicht verfügbar.
AWS Glue berechnet die Anzahl der unterschiedlichen Werte für jede Spalte der Iceberg-Tabelle in einer neuen Puffin-Datei, die an die angegebene Snapshot-ID an Ihrem Amazon S3-Standort übergeben wurde.