Pilih SerDe untuk data Anda - Amazon Athena

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Pilih SerDe untuk data Anda

Tabel berikut mencantumkan format data yang didukung di Athena dan pustaka yang sesuai SerDe .

Format data yang didukung dan SerDes
Format data Deskripsi SerDe jenis yang didukung di Athena
Amazon Ion Amazon Ion adalah format data yang kaya ketik dan mendeskripsikan diri yang merupakan superset, JSON dikembangkan, dan bersumber terbuka oleh Amazon. Gunakan Sarang Ion Amazon SerDe.

Apache Avro

Format untuk menyimpan data di Hadoop yang menggunakan skema JSON berbasis untuk nilai rekaman.

Gunakan Avro SerDe.

Apache Parquet

Sebuah format untuk penyimpanan kolumnar data di Hadoop.

Gunakan Parket SerDe dan SNAPPY kompresi.

Log Apache WebServer

Format untuk menyimpan log di Apache WebServer.

Gunakan Grok SerDe atauRegex SerDe.

CloudTrail log

Format untuk menyimpan log masuk CloudTrail.

CSV(Nilai yang Dipisahkan Koma)

Untuk data diCSV, setiap baris mewakili catatan data, dan setiap catatan terdiri dari satu atau lebih bidang, dipisahkan dengan koma.

Dibatasi Khusus

Untuk data dalam format ini, setiap baris mewakili catatan data, dan catatan dipisahkan oleh pembatas karakter tunggal kustom.

Gunakan Malas Sederhana SerDe untukCSV,TSV, dan file yang dibatasi khusus dan tentukan pembatas karakter tunggal kustom.

JSON(Notasi JavaScript Objek)

Untuk JSON data, setiap baris mewakili catatan data, dan setiap catatan terdiri dari pasangan nilai atribut dan array, dipisahkan dengan koma.

Log logstash

Format untuk menyimpan log di Logstash.

Gunakan Grok SerDe.

ORC(Kolom Baris yang Dioptimalkan)

Format untuk penyimpanan kolumnar data Hive yang dioptimalkan.

Gunakan ORC SerDe dan ZLIB kompresi.

TSV(Nilai yang Dipisahkan Tab)

Untuk data diTSV, setiap baris mewakili catatan data, dan setiap catatan terdiri dari satu atau lebih bidang, dipisahkan oleh tab.

Gunakan Malas Sederhana SerDe untukCSV,TSV, dan file yang dibatasi khusus dan tentukan karakter pemisah sebagaiFIELDS TERMINATED BY '\t'.