Wartung von S3 Tables - Amazon Simple Storage Service

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Wartung von S3 Tables

S3 Tables bietet Wartungsvorgänge, die dazu dienen, die Verwaltung und Leistung Ihrer Tabelle zu verbessern. Die folgenden Optionen sind standardmäßig für alle Tabellen aktiviert. Sie können sie bearbeiten oder deaktivieren, indem Sie Wartungskonfigurationsdateien für Ihre S3 Table angeben.

Für die Bearbeitung dieser Konfiguration sind die Berechtigungen s3tables:GetTableMaintenanceConfiguration und s3tables:PutTableMaintenanceConfiguration erforderlich.

Komprimierung

Bei einer Komprimierung werden kleinere Objekte zu weniger größeren Objekten kombiniert, um die Leistung von Iceberg-Abfragen zu verbessern. Beim Kombinieren von Objekten überträgt die Komprimierung auch die Auswirkungen von Löschungen auf Zeilenebene in Ihrer Tabelle. Amazon S3 komprimiert Tabellen auf der Grundlage einer für Ihr Datenzugriffsmuster optimalen Zieldateigröße oder eines von Ihnen festgelegten Werts. Die komprimierten Dateien werden als der neueste Snapshot Ihrer Tabelle geschrieben. Die Komprimierung ist standardmäßig für alle Tabellen aktiviert, wobei die standardmäßige Zieldateigröße 512 MB beträgt.

Anmerkung

Die Komprimierung wird nur unterstützt auf Apache Parquet Dateitypen.

Sie können eine Komprimierung nur auf Tabellenebene konfigurieren. Für die Komprimierung fallen zusätzliche Kosten an. Weitere Informationen finden Sie in den Preisinformationen unter Amazon S3 – Preise.

Um die Größe der Zieldatei für die Komprimierung zu konfigurieren, verwenden Sie AWS CLI

Im folgenden Beispiel wird die Zieldateigröße mithilfe der PutTableMaintenanceConfiguration-API auf 256 MB geändert.

aws s3tables put-table-maintenance-configuration \ --table-bucket-arn arn:aws:s3tables:us-east-1:111122223333:bucket/amzn-s3-demo-bucket1 \ --type icebergCompaction \ --namespace mynamespace \ --name testtable \ --value='{"status":"enabled","settings":{"icebergCompaction":{"targetFileSizeMB":256}}}'

Weitere Informationen finden Sie unter put-table-maintenance-configurationin der AWS CLI Befehlsreferenz.

Um die Komprimierung zu deaktivieren, verwenden Sie AWS CLI

Im folgenden Beispiel wird die Komprimierung mithilfe der PutTableMaintenanceConfiguration-API deaktiviert.

aws s3tables put-table-maintenance-configuration \ --table-bucket-arn arn:aws:s3tables:us-east-1:111122223333:bucket/amzn-s3-demo-table-bucket \ --type icebergCompaction \ --namespace mynamespace \ --name testtable \ --value='{"status":"disabled","settings":{"icebergCompaction":{"targetFileSizeMB":256}}}'

Weitere Informationen finden Sie unter put-table-maintenance-configurationin der AWS CLI Befehlsreferenz.

Snapshot-Verwaltung

Die Snapshot-Verwaltung bestimmt die Anzahl der aktiven Snapshots für Ihre Tabelle. Sie basiert auf MinimumSnapshots (standardmäßig 1) und MaximumSnapshotAge (standardmäßig 120 Stunden). Auf der Basis dieser Konfigurationen lässt die Snapshot-Verwaltung Tabellen-Snapshots ablaufen und entfernt sie.

Wenn ein Snapshot abläuft, markiert Amazon S3 alle Objekte, die nur von diesem Snapshot referenziert sind, als nicht aktuell. Diese veralteten Objekte werden nach Ablauf der Anzahl von Tagen gelöscht, die in Ihrer Richtlinie zur Entfernung nicht referenzierter Dateien als Eigenschaft NoncurrentDays festgelegt wurde.

Anmerkung

Das Löschen von Objekten, die nicht aktuell sind, ist dauerhaft und es besteht keine Möglichkeit, diese Objekte wiederherzustellen.

Um Objekte anzuzeigen oder wiederherzustellen, die als nicht aktuell markiert wurden, wenden Sie sich an AWS -Support. Informationen zur Kontaktaufnahme finden Sie AWS -Support unter Kontakt AWS oder in der AWS -Support Dokumentation.

Die Snapshot-Verwaltung bestimmt die Objekte, die aus Ihrer Tabelle gelöscht werden sollen, nur unter Beachtung der Referenzen zu dieser Tabelle. Außerhalb der Tabelle vorhandene Referenzen zu diesen Objekten hindern die Snapshot-Verwaltung nicht daran, ein Objekt zu löschen.

Anmerkung

Die Snapshot-Verwaltung unterstützt keine Aufbewahrungswerte, die Sie als Eigenschaften von Iceberg-Tabellen in der Datei metadata.json oder über den SQL-Befehl ALTER TABLE SET TBLPROPERTIES konfigurieren. Dies gilt auch für die verzweigungs- oder Tag-basierte Aufbewahrung. Die Snapshot-Verwaltung ist deaktiviert, wenn Sie eine verzweigungs- oder tagbasierte Aufbewahrungsrichtlinie oder eine Aufbewahrungsrichtlinie für die Datei metadata.json konfigurieren, die länger ist als die über die PutTableMaintenanceConfiguration-API konfigurierten Werte. In diesen Fällen lässt S3 Snapshots nicht ablaufen oder entfernen. Sie müssen die Snapshots manuell löschen oder die Eigenschaften aus Ihrer Iceberg-Tabelle entfernen, um Speichergebühren zu vermeiden.

Sie können die Snapshot-Verwaltung nur auf Tabellenebene konfigurieren. Weitere Informationen finden Sie in den Preisinformationen unter Amazon S3 – Preise.

Um das Snapshot-Management mit dem zu konfigurieren AWS CLI

Im folgenden Beispiel werden mithilfe der PutTableMaintenanceConfiguration-API der Wert MinimumSnapshots auf 10 und der Wert MaximumSnapshotAge auf 2.500 Stunden festgelegt.

aws s3tables put-table-maintenance-configuration \ --table-bucket-arn arn:aws:s3tables:us-east-1:111122223333:bucket/amzn-s3-demo-table-bucket \ --namespace my_namespace \ --name my_table \ --type icebergSnapshotManagement \ --value '{"status":"enabled","settings":{"icebergSnapshotManagement":{"minSnapshotsToKeep":10,"maxSnapshotAgeHours":2500}}}'

Weitere Informationen finden Sie unter put-table-maintenance-configurationin der AWS CLI Befehlsreferenz.

Überlegungen und Einschränkungen

Weitere Informationen zu zusätzlichen Überlegungen und Einschränkungen bei der Komprimierung und Snapshot-Verwaltung finden Sie unter Überlegungen und Einschränkungen für Wartungsarbeiten.