Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Datenformate für AWS Clean Rooms
Um Daten abzufragen, müssen die Datensätze in einem Format vorliegen, das dies AWS Clean Rooms unterstützt. Der Amazon S3 S3-Bucket mit den Datensätzen und der AWS Clean Rooms Cluster müssen sich im selben AWS-Region befinden.
Unterstützte Datumsformate
AWS Clean Rooms unterstützt die folgenden strukturierten Formate:
-
Parquet
-
RCFile
-
TextFile
-
SequenceFile
-
RegexSerde
-
OpenCSV
-
AVRO
-
JSON
Anmerkung
Ein timestamp
Wert in einer Textdatei muss das folgende Format yyyy-MM-dd
HH:mm:ss.SSSSSS
haben. Zum Beispiel:2017-05-01 11:30:59.000000
.
Wir empfehlen die Verwendung eines spaltenförmigen Speicherdateiformats wieApache Parquet. Mit einem solchen Format minimieren Sie die Datenübertragung aus Amazon S3, indem Sie nur die benötigten Spalten auswählen. Für eine optimale Leistung sollten große Objekte in Objekte mit einer Größe von 100 MB bis 1 GB aufgeteilt werden.
Unterstützte Datentypen
Für eine optimale Benutzererfahrung müssen alle Ihre Daten katalogisiert werden. AWS Clean Rooms AWS Glue Weitere Informationen finden Sie im Abschnitt Erste Schritte mit dem AWS Glue Data Catalog im AWS Glue Entwicklerhandbuch.
AWS Clean Rooms unterstützt die folgenden AWS Glue Data Catalog Datentypen:
-
bigint
-
boolean
-
char
-
date
-
decimal
-
double
-
float
-
int
-
Verschachtelte Datentypen wie:
-
array
-
map
-
struct
-
-
smallint
-
string
-
timestamp
-
varchar
AWS Clean Rooms unterstützt nicht:
-
Binary
-
Intervall
Arten der Dateikomprimierung für AWS Clean Rooms
Um Speicherplatz zu reduzieren, die Leistung zu verbessern und die Kosten zu minimieren, empfehlen wir dringend, Ihre Datensätze zu komprimieren.
AWS Clean Rooms erkennt Dateikomprimierungstypen anhand der Dateierweiterung und unterstützt die in der folgenden Tabelle aufgeführten Komprimierungstypen und -erweiterungen.
Komprimierungsalgorithmus | Dateierweiterung |
---|---|
GZIP | .gz |
Bzip2 | .bz2 |
Snappy | .snappy |
Sie können die Komprimierung auf verschiedenen Ebenen anwenden. Zumeist komprimieren Sie eine ganze Datei oder einzelne Blöcke innerhalb einer Datei. Das Komprimieren von Spaltenformaten auf Dateiebene bringt keine Leistungsvorteile.
Serverseitige Verschlüsselung für AWS Clean Rooms
Anmerkung
Die serverseitige Verschlüsselung ersetzt nicht die kryptografische Datenverarbeitung in den Anwendungsfällen, in denen sie erforderlich ist.
AWS Clean Rooms entschlüsselt transparent Datensätze, die mit den folgenden Verschlüsselungsoptionen verschlüsselt wurden:
-
SSE-S3 — Serverseitige Verschlüsselung mit einem AES -256-Verschlüsselungsschlüssel, der von Amazon S3 verwaltet wird
-
SSE- KMS — Serverseitige Verschlüsselung mit Schlüsseln, die verwaltet werden von AWS Key Management Service
Um SSE -S3 verwenden zu können, muss die AWS Clean Rooms Servicerolle, mit der die konfigurierte Tabelle der Kollaboration zugeordnet wurde, über KMS -decrypt-Berechtigungen verfügen. Um SSE - verwenden zu könnenKMS, muss die KMS Schlüsselrichtlinie auch die Entschlüsselung der AWS Clean Rooms Servicerolle zulassen.
AWS Clean Rooms unterstützt keine clientseitige Amazon S3 S3-Verschlüsselung. Weitere Informationen zur serverseitigen Verschlüsselung finden Sie unter Schützen von Daten mithilfe serverseitiger Verschlüsselung im Amazon Simple Storage Service-Benutzerhandbuch.