Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Saat Anda menggunakan Athena untuk membaca tabel Apache Hudi, pertimbangkan poin-poin berikut.
-
Pertanyaan tambahan - Athena tidak mendukung kueri tambahan.
-
CTAS — Athena tidak mendukung CTAS INSERT INTO atau data Hudi. Jika Anda ingin dukungan Athena untuk menulis set data Hudi, kirim umpan balik ke
<athena-feedback@amazon.com>
.Untuk informasi selengkapnya tentang penulisan data Hudi, lihat sumber daya berikut:
-
Bekerja dengan kumpulan data Hudi di Panduan Rilis EMR Amazon.
-
Menulis Data
dalam dokumentasi Apache Hudi.
-
-
MSCK REPAIR TABLE - Menggunakan MSCK REPAIR TABLE pada tabel Hudi di Athena tidak didukung. Jika Anda perlu memuat tabel Hudi yang tidak dibuat AWS Glue, gunakanALTER TABLE ADD PARTITION.
-
Melewatkan objek S3 Glacier tidak didukung - Jika objek di tabel Apache Hudi berada dalam kelas penyimpanan Amazon S3 Glacier, menyetel properti tabel agar tidak berpengaruh.
read_restored_glacier_objects
false
Misalnya, Anda mengeluarkan perintah berikut:
ALTER TABLE
table_name
SET TBLPROPERTIES ('read_restored_glacier_objects' = 'false')Untuk tabel Iceberg dan Delta Lake, perintah menghasilkan kesalahan Kunci
properti tabel Tidak didukung
: read_restored_glacier_objects. Untuk tabel Hudi,ALTER TABLE
perintah tidak menghasilkan kesalahan, tetapi objek Amazon S3 Glacier masih belum dilewati. MenjalankanSELECT
kueri setelahALTER TABLE
perintah terus mengembalikan semua objek. -
Kueri stempel waktu — Saat ini, kueri yang mencoba membaca kolom stempel waktu dalam tabel waktu nyata Hudi gagal atau menghasilkan hasil kosong. Batasan ini hanya berlaku untuk kueri yang membaca kolom stempel waktu. Kueri yang hanya menyertakan kolom non-stempel waktu dari tabel yang sama berhasil.
Kueri yang gagal mengembalikan pesan yang mirip dengan berikut ini:
GENERIC_INTERNAL_ERROR: kelas org.apache.hadoop.io. ArrayWritabletidak dapat dilemparkan ke kelas org.apache.hadoop.hive.serde2.io. TimestampWritableV2 (org.apache.hadoop.io. ArrayWritable dan org.apache.hadoop.hive.serde2.io. TimestampWritableV2 berada dalam modul loader io.trino.server yang tidak disebutkan namanya. PluginClassLoader @75c67992)