Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Wartung von S3 Tables
S3 Tables bietet Wartungsvorgänge, die dazu dienen, die Verwaltung und Leistung Ihrer Tabelle zu verbessern. Die folgenden Optionen sind standardmäßig für alle Tabellen aktiviert. Sie können sie bearbeiten oder deaktivieren, indem Sie Wartungskonfigurationsdateien für Ihre S3 Table angeben.
Für die Bearbeitung dieser Konfiguration sind die Berechtigungen s3tables:GetTableMaintenanceConfiguration
und s3tables:PutTableMaintenanceConfiguration
erforderlich.
Komprimierung
Bei einer Komprimierung werden kleinere Objekte zu weniger größeren Objekten kombiniert, um die Leistung von Iceberg-Abfragen zu verbessern. Beim Kombinieren von Objekten überträgt die Komprimierung auch die Auswirkungen von Löschungen auf Zeilenebene in Ihrer Tabelle. Amazon S3 komprimiert Tabellen auf der Grundlage einer für Ihr Datenzugriffsmuster optimalen Zieldateigröße oder eines von Ihnen festgelegten Werts. Die komprimierten Dateien werden als der neueste Snapshot Ihrer Tabelle geschrieben. Die Komprimierung ist standardmäßig für alle Tabellen aktiviert, wobei die standardmäßige Zieldateigröße 512 MB beträgt.
Anmerkung
Die Komprimierung wird nur unterstützt auf Apache Parquet Dateitypen.
Sie können eine Komprimierung nur auf Tabellenebene konfigurieren. Für die Komprimierung fallen zusätzliche Kosten an. Weitere Informationen finden Sie in den Preisinformationen unter Amazon S3 – Preise
- Um die Größe der Zieldatei für die Komprimierung zu konfigurieren, verwenden Sie AWS CLI
-
Im folgenden Beispiel wird die Zieldateigröße mithilfe der
PutTableMaintenanceConfiguration
-API auf 256 MB geändert.aws s3tables put-table-maintenance-configuration \ --table-bucket-arn arn:aws:s3tables:
us-east-1
:111122223333
:bucket/amzn-s3-demo-bucket1
\ --type icebergCompaction \ --namespacemynamespace
\ --nametesttable
\ --value='{"status":"enabled","settings":{"icebergCompaction":{"targetFileSizeMB":256}}}'Weitere Informationen finden Sie unter put-table-maintenance-configuration
in der AWS CLI Befehlsreferenz. - Um die Komprimierung zu deaktivieren, verwenden Sie AWS CLI
-
Im folgenden Beispiel wird die Komprimierung mithilfe der
PutTableMaintenanceConfiguration
-API deaktiviert.aws s3tables put-table-maintenance-configuration \ --table-bucket-arn arn:aws:s3tables:
us-east-1
:111122223333
:bucket/amzn-s3-demo-table-bucket \ --type icebergCompaction \ --namespacemynamespace
\ --nametesttable
\ --value='{"status":"disabled","settings":{"icebergCompaction":{"targetFileSizeMB":256}}}'Weitere Informationen finden Sie unter put-table-maintenance-configuration
in der AWS CLI Befehlsreferenz.
Snapshot-Verwaltung
Die Snapshot-Verwaltung bestimmt die Anzahl der aktiven Snapshots für Ihre Tabelle. Sie basiert auf MinimumSnapshots
(standardmäßig 1) und MaximumSnapshotAge
(standardmäßig 120 Stunden). Auf der Basis dieser Konfigurationen lässt die Snapshot-Verwaltung Tabellen-Snapshots ablaufen und entfernt sie.
Wenn ein Snapshot abläuft, markiert Amazon S3 alle Objekte, die nur von diesem Snapshot referenziert sind, als nicht aktuell. Diese veralteten Objekte werden nach Ablauf der Anzahl von Tagen gelöscht, die in Ihrer Richtlinie zur Entfernung nicht referenzierter Dateien als Eigenschaft NoncurrentDays
festgelegt wurde.
Anmerkung
Das Löschen von Objekten, die nicht aktuell sind, ist dauerhaft und es besteht keine Möglichkeit, diese Objekte wiederherzustellen.
Um Objekte anzuzeigen oder wiederherzustellen, die als nicht aktuell markiert wurden, wenden Sie sich an AWS -Support. Informationen zur Kontaktaufnahme finden Sie AWS -Support unter Kontakt AWS
Die Snapshot-Verwaltung bestimmt die Objekte, die aus Ihrer Tabelle gelöscht werden sollen, nur unter Beachtung der Referenzen zu dieser Tabelle. Außerhalb der Tabelle vorhandene Referenzen zu diesen Objekten hindern die Snapshot-Verwaltung nicht daran, ein Objekt zu löschen.
Anmerkung
Die Snapshot-Verwaltung unterstützt keine Aufbewahrungswerte, die Sie als Eigenschaften von Iceberg-Tabellen in der Datei metadata.json
oder über den SQL-Befehl ALTER TABLE SET TBLPROPERTIES
konfigurieren. Dies gilt auch für die verzweigungs- oder Tag-basierte Aufbewahrung. Die Snapshot-Verwaltung ist deaktiviert, wenn Sie eine verzweigungs- oder tagbasierte Aufbewahrungsrichtlinie oder eine Aufbewahrungsrichtlinie für die Datei metadata.json
konfigurieren, die länger ist als die über die PutTableMaintenanceConfiguration
-API konfigurierten Werte. In diesen Fällen lässt S3 Snapshots nicht ablaufen oder entfernen. Sie müssen die Snapshots manuell löschen oder die Eigenschaften aus Ihrer Iceberg-Tabelle entfernen, um Speichergebühren zu vermeiden.
Sie können die Snapshot-Verwaltung nur auf Tabellenebene konfigurieren. Weitere Informationen finden Sie in den Preisinformationen unter Amazon S3 – Preise
- Um das Snapshot-Management mit dem zu konfigurieren AWS CLI
-
Im folgenden Beispiel werden mithilfe der
PutTableMaintenanceConfiguration
-API der WertMinimumSnapshots
auf 10 und der WertMaximumSnapshotAge
auf 2.500 Stunden festgelegt.aws s3tables put-table-maintenance-configuration \ --table-bucket-arn arn:aws:s3tables:
us-east-1
:111122223333
:bucket/amzn-s3-demo-table-bucket \ --namespacemy_namespace
\ --namemy_table
\ --type icebergSnapshotManagement \ --value '{"status":"enabled","settings":{"icebergSnapshotManagement":{"minSnapshotsToKeep":10,"maxSnapshotAgeHours":2500}}}'
Weitere Informationen finden Sie unter put-table-maintenance-configuration
Überlegungen und Einschränkungen
Weitere Informationen zu zusätzlichen Überlegungen und Einschränkungen bei der Komprimierung und Snapshot-Verwaltung finden Sie unter Überlegungen und Einschränkungen für Wartungsarbeiten.