Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
In der folgenden Tabelle sind die in Athena unterstützten Datenformate und die entsprechenden SerDe Bibliotheken aufgeführt.
Data format (Datenformat) | Beschreibung | SerDe Typen, die in Athena unterstützt werden |
---|---|---|
Amazon Ion | Amazon Ion ist ein reich typisiertes, sich selbst beschreibendes Datenformat, das eine Weiterentwicklung von Amazon istJSON, von Amazon entwickelt und als Open Source bereitgestellt wird. | Verwenden Sie die Amazon Ion Hive SerDe. |
Apache Avro |
Ein Format zum Speichern von Daten in Hadoop, das basierte Schemas für Datensatzwerte verwendet. JSON |
Verwenden Sie Avro SerDe. |
Apache Parquet |
Ein Format für die spaltenbasierte Speicherung von Daten in Hadoop. |
Verwenden Sie die Komprimierung Parkett SerDe und. SNAPPY |
WebServer Apache-Protokolle |
Ein Format zum Speichern von Protokollen in Apache WebServer. |
Verwenden Sie die Grok SerDe oder Regex SerDe. |
CloudTrail Logs |
Ein Format zum Speichern von Protokollen CloudTrail. |
|
CSV(Kommagetrennte Werte) |
Bei CSV eingehenden Daten steht jede Zeile für einen Datensatz, und jeder Datensatz besteht aus einem oder mehreren Feldern, die durch Kommas getrennt sind. |
|
Benutzerdefiniert, durch Trennzeichen getrennt |
Bei Daten in diesem Format stellt jede Zeile einen Datensatz dar. Die Datensätze sind durch benutzerdefinierte aus einem Zeichen bestehende Trennzeichen getrennt. |
Verwenden Sie die Lazy Simple SerDe für CSVTSV, und benutzerdefinierte Dateien mit Trennzeichen und geben Sie ein einzelnes benutzerdefiniertes Trennzeichen an. |
JSON(JavaScript Objektnotation) |
Bei JSON Daten steht jede Zeile für einen Datensatz, und jeder Datensatz besteht aus Attributwertpaaren und Arrays, die durch Kommas getrennt sind. |
|
Logstash-Protokolle |
Ein Format zum Speichern von Protokollen in Logstash. |
Verwenden Sie Grok SerDe. |
ORC(Optimierte Zeile, spaltenweise) |
Ein Format für die optimierte spaltenbasierte Speicherung von Hive-Daten. |
Verwenden Sie die ZLIB Komprimierung ORC SerDe und. |
TSV(Tabulatorgetrennte Werte) |
Bei TSV eingehenden Daten steht jede Zeile für einen Datensatz, und jeder Datensatz besteht aus einem oder mehreren Feldern, die durch Tabulatoren getrennt sind. |
Verwenden Sie die Lazy Simple SerDe für CSVTSV, und benutzerdefinierte Dateien mit Trennzeichen und geben Sie das Trennzeichen als |