Gunakan format tabel non-sarang di Athena untuk Spark

Saat Anda bekerja dengan sesi dan notebook di Athena untuk Spark, Anda dapat menggunakan tabel Linux Foundation Delta Lake, Apache Hudi, dan Apache Iceberg, selain tabel Apache Hive.

Pertimbangan dan batasan

Bila Anda menggunakan format tabel selain Apache Hive dengan Athena untuk Spark, pertimbangkan hal-hal berikut:

Selain Apache Hive, hanya satu format tabel yang didukung per notebook. Untuk menggunakan beberapa format tabel di Athena untuk Spark, buat buku catatan terpisah untuk setiap format tabel. Untuk informasi tentang membuat notebook di Athena untuk Spark, lihat. Langkah 7: Buat buku catatan Anda sendiri
Format tabel Delta Lake, Hudi, dan Iceberg telah diuji di Athena untuk Spark dengan menggunakan AWS Glue sebagai metastore. Anda mungkin dapat menggunakan metastores lain, tetapi penggunaan tersebut saat ini tidak didukung.
Untuk menggunakan format tabel tambahan, ganti spark_catalog properti default, seperti yang ditunjukkan di konsol Athena dan dalam dokumentasi ini. Katalog non-sarang ini dapat membaca tabel Hive, selain format tabelnya sendiri.

Versi tabel

Tabel berikut menunjukkan didukung versi tabel non-HIVE di Amazon Athena untuk Apache Spark.

Format tabel	Versi yang didukung
Gunung Es Apache	1.2.1
Apache Hudi	0,13
Yayasan Linux Delta Lake	2.0.2

Di Athena for Spark, .jar file format tabel ini dan dependensinya dimuat ke classpath untuk driver dan pelaksana Spark.

Untuk sebuah AWS Posting Blog Big Data yang menunjukkan cara bekerja dengan format tabel Iceberg, Hudi, dan Delta Lake menggunakan Spark di notebook Amazon Athena, lihat Menggunakan SQL Amazon Athena dengan Spark untuk format tabel transaksional sumber terbuka Anda. SQL

Topik

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Sihir grafik

Gunung es