Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Anda dapat menggunakan Athena untuk melakukan membaca, perjalanan waktu, menulis, dan kueri DDL pada tabel Apache Iceberg. Tabel Iceberg harus menggunakan format Apache Parquet untuk data dan AWS Glue katalog untuk metastore mereka.
Apache Iceberg
Untuk informasi lebih lanjut tentang Apache Iceberg, lihat https://iceberg.apache.org/.
Pertimbangan dan batasan
Dukungan Athena untuk tabel Iceberg memiliki pertimbangan dan batasan berikut:
-
Dukungan versi Iceberg - Athena mendukung Apache Iceberg versi 1.4.2.
-
Tabel dengan AWS Glue katalog saja — Hanya tabel Iceberg yang dibuat berdasarkan AWS Glue katalog berdasarkan spesifikasi yang ditentukan oleh implementasi katalog lem open source
yang didukung dari Athena. -
Dukungan penguncian meja AWS Glue hanya dengan - Tidak seperti implementasi katalog Glue open source, yang mendukung penguncian khusus plug-in, Athena hanya AWS Glue mendukung penguncian optimis. Menggunakan Athena untuk memodifikasi tabel Iceberg dengan implementasi kunci lainnya akan menyebabkan potensi kehilangan data dan merusak transaksi.
-
Format file yang didukung - Dukungan format file Iceberg di Athena tergantung pada versi mesin Athena, seperti yang ditunjukkan pada tabel berikut.
-
Metadata terbatas gunung es — Lake Formation tidak mengevaluasi tabel metadata Gunung Es. Oleh karena itu, tabel metadata Gunung Es dibatasi jika ada baris Lake Formation atau filter sel yang ada di tabel dasar atau jika Anda tidak memiliki izin untuk melihat semua kolom di tabel dasar. Untuk kasus seperti itu, ketika Anda menanyakan tabel metadata
$partitions
$files
$manifests
,,, dan$snapshots
Iceberg, itu gagal dan Anda mendapatkan kesalahan.AccessDeniedException
Selain itu, kolom metadata$path
memiliki batasan Lake Formation yang sama dan gagal saat dipilih oleh kueri. Semua tabel metadata lainnya dapat ditanyakan terlepas dari filter Lake Formation. Untuk informasi selengkapnya, lihat Tabel metadata. Versi mesin Athena Parquet ORC Avro 2 Ya Tidak Tidak 3 Ya Ya Ya -
Tabel Iceberg v2 — Athena hanya membuat dan beroperasi pada tabel Iceberg v2. Untuk perbedaan antara tabel v1 dan v2, lihat Format perubahan versi dalam dokumentasi
Apache Iceberg. -
Tampilan jenis waktu tanpa zona waktu - Waktu dan stempel waktu tanpa jenis zona waktu ditampilkan di UTC. Jika zona waktu tidak ditentukan dalam ekspresi filter pada kolom waktu, UTC digunakan.
-
Presisi data terkait stempel waktu — Meskipun Iceberg mendukung presisi mikrodetik untuk tipe data stempel waktu, Athena hanya mendukung presisi milidetik untuk stempel waktu dalam membaca dan menulis. Untuk data dalam kolom terkait waktu yang ditulis ulang selama operasi pemadatan manual, Athena hanya mempertahankan presisi milidetik.
-
Operasi yang tidak didukung - Operasi Athena berikut tidak didukung untuk tabel Iceberg.
-
Tampilan — Gunakan
CREATE VIEW
untuk membuat tampilan Athena seperti yang dijelaskan dalam. Bekerja dengan pandangan Jika Anda tertarik menggunakan spesifikasi tampilan Gunung Es untuk membuat tampilan, hubungi athena-feedback@amazon.com. -
Perintah manajemen TTF tidak didukung di AWS Lake Formation - Meskipun Anda dapat menggunakan Lake Formation untuk mengelola izin akses baca untuk TransactionTable Format (TTFs) seperti Apache Iceberg, Apache Hudi, dan Linux Foundation Delta Lake, Anda tidak dapat menggunakan Lake Formation untuk mengelola izin untuk operasi seperti,, atau dengan format tabel ini.
VACUUM
MERGE
UPDATE
OPTIMIZE
Untuk informasi selengkapnya tentang integrasi Lake Formation dengan Athena, lihat Menggunakan AWS Lake Formation dengan Amazon Athena di AWS Lake Formation Panduan Pengembang. -
Partisi dengan bidang bersarang - Partisi dengan bidang bersarang tidak didukung. Mencoba melakukannya menghasilkan pesan
NOT_SUPPORTED: Partisi dengan bidang bersarang tidak didukung:
.column_name
nested_field_name
. -
Melewati objek S3 Glacier tidak didukung - Jika objek di tabel Apache Iceberg berada dalam kelas penyimpanan Amazon S3 Glacier, menyetel properti tabel agar tidak berpengaruh.
read_restored_glacier_objects
false
Misalnya, Anda mengeluarkan perintah berikut:
ALTER TABLE
table_name
SET TBLPROPERTIES ('read_restored_glacier_objects' = 'false')Untuk tabel Iceberg dan Delta Lake, perintah menghasilkan kesalahan Kunci
properti tabel Tidak didukung
: read_restored_glacier_objects. Untuk tabel Hudi,ALTER TABLE
perintah tidak menghasilkan kesalahan, tetapi objek Amazon S3 Glacier masih belum dilewati. MenjalankanSELECT
kueri setelahALTER TABLE
perintah terus mengembalikan semua objek.
Jika Anda ingin Athena mendukung fitur tertentu, kirim umpan balik ke athena-feedback@amazon.com.