Wählen Sie eine SerDe für Ihre Daten

Fokusmodus

Wählen Sie eine SerDe für Ihre Daten - Amazon Athena

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

In der folgenden Tabelle sind die in Athena unterstützten Datenformate und die entsprechenden SerDe Bibliotheken aufgeführt.

Unterstützte Datenformate und SerDes
Data format (Datenformat)	Beschreibung	SerDe Typen, die in Athena unterstützt werden
Amazon Ion	Amazon Ion ist ein reich typisiertes, sich selbst beschreibendes Datenformat, das eine Weiterentwicklung von Amazon istJSON, von Amazon entwickelt und als Open Source bereitgestellt wird.	Verwenden Sie die Amazon Ion Hive SerDe.
Apache Avro	Ein Format zum Speichern von Daten in Hadoop, das basierte Schemas für Datensatzwerte verwendet. JSON	Verwenden Sie Avro SerDe.
Apache Parquet	Ein Format für die spaltenbasierte Speicherung von Daten in Hadoop.	Verwenden Sie die Komprimierung Parkett SerDe und. SNAPPY
WebServer Apache-Protokolle	Ein Format zum Speichern von Protokollen in Apache WebServer.	Verwenden Sie die Grok SerDe oder Regex SerDe.
CloudTrail Logs	Ein Format zum Speichern von Protokollen CloudTrail.	Verwenden Sie die Bienenstock JSON SerDe. Weitere Informationen finden Sie unter AWS CloudTrail Logs abfragen.
CSV(Kommagetrennte Werte)	Bei CSV eingehenden Daten steht jede Zeile für einen Datensatz, und jeder Datensatz besteht aus einem oder mehreren Feldern, die durch Kommas getrennt sind.	Verwenden Sie das Lazy Simple SerDe für CSVTSV, und benutzerdefinierte Dateien mit Trennzeichen, wenn Ihre Daten keine in Anführungszeichen eingeschlossenen Werte enthalten oder das Format `java.sql.Timestamp` verwendet wird. Verwenden Sie dieCSV SerDe Zur Bearbeitung geöffnet CSV, wenn Ihre Daten Anführungszeichen in Werten enthalten oder das UNIX numerische Format für verwenden `TIMESTAMP` (z. B.`1564610311`).
Benutzerdefiniert, durch Trennzeichen getrennt	Bei Daten in diesem Format stellt jede Zeile einen Datensatz dar. Die Datensätze sind durch benutzerdefinierte aus einem Zeichen bestehende Trennzeichen getrennt.	Verwenden Sie die Lazy Simple SerDe für CSVTSV, und benutzerdefinierte Dateien mit Trennzeichen und geben Sie ein einzelnes benutzerdefiniertes Trennzeichen an.
JSON(JavaScript Objektnotation)	Bei JSON Daten steht jede Zeile für einen Datensatz, und jeder Datensatz besteht aus Attributwertpaaren und Arrays, die durch Kommas getrennt sind.	Verwenden Sie Bienenstock JSON SerDe. Verwenden Sie OpenX JSON SerDe.
Logstash-Protokolle	Ein Format zum Speichern von Protokollen in Logstash.	Verwenden Sie Grok SerDe.
ORC(Optimierte Zeile, spaltenweise)	Ein Format für die optimierte spaltenbasierte Speicherung von Hive-Daten.	Verwenden Sie die ZLIB Komprimierung ORC SerDe und.
TSV(Tabulatorgetrennte Werte)	Bei TSV eingehenden Daten steht jede Zeile für einen Datensatz, und jeder Datensatz besteht aus einem oder mehreren Feldern, die durch Tabulatoren getrennt sind.	Verwenden Sie die Lazy Simple SerDe für CSVTSV, und benutzerdefinierte Dateien mit Trennzeichen und geben Sie das Trennzeichen als `FIELDS TERMINATED BY '\t'` an.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Benutzen SerDes

Verwenden Sie a SerDe , um eine Tabelle zu erstellen

Wählen Sie Ihre Cookie-Einstellungen aus

Cookie-Einstellungen anpassen

Essenziell

Leistung

Funktional

Werbung

Cookie-Einstellungen konnten nicht gespeichert werden

Wählen Sie eine SerDe für Ihre Daten

Hat Ihnen diese Seite geholfen?

Nächstes Thema:

Vorheriges Thema:

Brauchen Sie Hilfe?