Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Referensi SerDe properti Amazon Ion
Topik ini berisi informasi tentang SerDe properti untuk CREATE TABLE
pernyataan di Athena. Untuk informasi selengkapnya dan contoh penggunaan SerDe properti Amazon Ion, lihat SerDe properti
Cara menentukan SerDe properti Amazon Ion
Untuk menentukan properti untuk Amazon Ion Hive SerDe dalam CREATE TABLE
pernyataan Anda, gunakan WITH SERDEPROPERTIES
klausa. Karena WITH
SERDEPROPERTIES
merupakan subfield dari ROW FORMAT SERDE
klausa, Anda harus menentukan ROW FORMAT SERDE
dan jalur SerDe kelas Amazon Ion Hive terlebih dahulu, seperti yang ditunjukkan sintaks berikut.
... ROW FORMAT SERDE 'com.amazon.ionhiveserde.IonHiveSerDe' WITH SERDEPROPERTIES ( '
property
' = 'value
', 'property
' = 'value
', ... )
Perhatikan bahwa meskipun ROW FORMAT SERDE
klausa diperlukan jika Anda ingin menggunakanWITH SERDEPROPERTIES
, Anda dapat menggunakan salah satu STORED AS ION
atau yang lebih panjang INPUTFORMAT
dan OUTPUTFORMAT
sintaks untuk menentukan format Amazon Ion.
SerDe Properti Amazon Ion
Berikut ini adalah SerDe properti Amazon Ion yang dapat digunakan dalam CREATE
TABLE
pernyataan di Athena.
- ion.pengkodean
-
Opsional
Default:
BINARY
Nilai:
BINARY
,TEXT
Properti ini menyatakan apakah nilai baru yang ditambahkan diserialisasikan sebagai biner Amazon Ion
atau format teks Amazon Ion. Contoh SerDe properti berikut menentukan format teks Amazon Ion.
'ion.encoding' = 'TEXT'
- ion.fail_on_overflow
-
Opsional
Default:
true
Nilai:
true
,false
Amazon Ion memungkinkan tipe numerik yang besar secara sewenang-wenang sementara Hive tidak. Secara default, SerDe gagal jika nilai Amazon Ion tidak sesuai dengan kolom Hive, tetapi Anda dapat menggunakan opsi
fail_on_overflow
konfigurasi untuk membiarkan nilai meluap alih-alih gagal.Properti ini dapat diatur pada tingkat tabel atau kolom. Untuk menentukannya di tingkat tabel, tentukan
ion.fail_on_overflow
seperti pada contoh berikut. Ini menetapkan perilaku default untuk semua kolom.'ion.fail_on_overflow' = 'true'
Untuk mengontrol kolom tertentu, tentukan nama kolom antara
ion
danfail_on_overflow
, dibatasi oleh periode, seperti pada contoh berikut.'ion.
<column>
.fail_on_overflow' = 'false' - ion.path_extractor.case_sensitive
-
Opsional
Default:
false
Nilai:
true
,false
Menentukan apakah akan memperlakukan nama bidang Amazon Ion sebagai peka huruf besar/kecil. Kapan
false
, kasus SerDe mengabaikan penguraian nama bidang Amazon Ion.Misalnya, Anda memiliki skema tabel Hive yang mendefinisikan bidang
alias
dalam huruf kecil dan dokumen Amazon Ion denganalias
bidang danALIAS
bidang, seperti pada contoh berikut.-- Hive Table Schema alias: STRING -- Amazon Ion Document { 'ALIAS': 'value1'} { 'alias': 'value2'}
Contoh berikut menunjukkan SerDe properti dan tabel diekstraksi yang dihasilkan ketika sensitivitas kasus diatur ke
false
:-- Serde properties 'ion.alias.path_extractor' = '(alias)' 'ion.path_extractor.case_sensitive' = 'false' --Extracted Table | alias | |----------| | "value1" | | "value2" |
Contoh berikut menunjukkan SerDe properti dan tabel diekstraksi yang dihasilkan ketika sensitivitas kasus diatur ke
true
:-- Serde properties 'ion.alias.path_extractor' = '(alias)' 'ion.path_extractor.case_sensitive' = 'true' --Extracted Table | alias | |----------| | "value2" |
Dalam kasus kedua,
value1
untukALIAS
bidang diabaikan ketika sensitivitas kasus disetel ketrue
dan ekstraktor jalur ditentukan sebagaialias
. - ion.
<column>
.path_extractor -
Opsional
Default: NA
Nilai: String dengan jalur pencarian
Membuat ekstraktor jalur dengan jalur pencarian yang ditentukan untuk kolom yang diberikan. Ekstraktor jalur memetakan bidang Amazon Ion ke kolom Hive. Jika tidak ada ekstraktor jalur yang ditentukan, Athena secara dinamis membuat ekstraktor jalur pada waktu berjalan berdasarkan nama kolom.
Contoh berikut path extractor memetakan
example_ion_field
ke.example_hive_column
'ion.example_hive_column.path_extractor' = '(example_ion_field)'
Untuk informasi selengkapnya tentang ekstraktor jalur dan jalur pencarian, lihatGunakan ekstraktor jalur.
- ion.timestamp.serialization_offset
-
Opsional
Default:
'Z'
Nilai:
OFFSET
, di manaOFFSET
direpresentasikan sebagai
. Contoh nilai:<signal>
hh:mm01:00
,+01:00
,-09:30
,Z
(UTC, sama seperti 00:00)Tidak seperti cap waktu
Apache Hive, yang tidak memiliki zona waktu bawaan dan disimpan sebagai offset dari zamanUNIX, stempel waktu Amazon Ion memang memiliki offset. Gunakan properti ini untuk menentukan offset saat Anda membuat serial ke Amazon Ion. Contoh berikut menambahkan offset satu jam.
'ion.timestamp.serialization_offset' = '+01:00'
- ion.serialize_null
-
Opsional
Default:
OMIT
Nilai:
OMIT
,UNTYPED
,TYPED
Amazon Ion SerDe dapat dikonfigurasi untuk membuat serial atau menghilangkan kolom yang memiliki nilai nol. Anda dapat memilih untuk menulis nulls () yang diketik kuat atau nulls yang tidak diketik (
TYPED
).UNTYPED
Null yang diketik dengan kuat ditentukan berdasarkan pemetaan tipe Amazon Ion ke Hive default.Contoh berikut menentukan null yang diketik kuat.
'ion.serialize_null'='TYPED'
- ion.ignore_malformed
-
Opsional
Default:
false
Nilai:
true
,false
Kapan
true
, abaikan entri yang salah bentuk atau seluruh file jika tidak dapat SerDe membacanya. Untuk informasi selengkapnya, lihat Abaikan cacatdalam dokumentasi. GitHub - ion.
<column>
.serialize_as -
Opsional
Default: Jenis default untuk kolom.
Nilai: String yang berisi tipe Amazon Ion
Menentukan tipe data Amazon Ion di mana nilai diserialisasikan. Karena jenis Amazon Ion dan Hive tidak selalu memiliki pemetaan langsung, beberapa tipe Hive memiliki beberapa tipe data yang valid untuk serialisasi. Untuk membuat serial data sebagai tipe data non-default, gunakan properti ini. Untuk informasi selengkapnya tentang pemetaan tipe, lihat halaman pemetaan Jenis
Ion Amazon. GitHub Secara default, kolom Hive biner diserialisasikan sebagai gumpalan Amazon Ion, tetapi mereka juga dapat diserialkan sebagai gumpalan Ion Amazon
(objek besar karakter). Contoh berikut membuat serial kolom example_hive_binary_column
sebagai gumpalan.'ion.example_hive_binary_column.serialize_as' = 'clob'