Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pertimbangan dan batasan
-
Delta Lake didukung untuk digunakan dengan Amazon EMR rilis 6.9.0 dan lebih tinggi. Anda dapat menggunakan Apache Spark 3.x
pada cluster EMR Amazon dengan tabel Delta. -
Kami menyarankan Anda menggunakan skema URI s3 untuk jalur lokasi S3 alih-alih s3a untuk kinerja, keamanan, dan keandalan terbaik. Untuk informasi selengkapnya lihat Bekerja dengan penyimpanan dan sistem file.
-
Dengan Amazon EMR 7.0, Delta Universal Format (UniForm) dan convert-to-Iceberg pernyataan tidak didukung.
-
Dengan Amazon EMR 6.9 dan 6.10, saat Anda menyimpan data tabel Delta Lake di Amazon S3, data kolom menjadi setelah operasi penggantian nama kolom.
NULL
Masalah ini diselesaikan dengan Amazon EMR 6.11. Untuk informasi selengkapnya tentang operasi ganti nama kolom eksperimental, lihat Operasi ganti nama kolomdi Panduan Pengguna Delta Lake. -
Jika Anda membuat database di AWS Glue Data Catalog di luar Apache Spark, database bisa memiliki bidang kosong
LOCATION
. Karena Spark tidak mengizinkan database dibuat dengan properti lokasi kosong, Anda akan mendapatkan kesalahan berikut jika Anda menggunakan Spark di Amazon EMR untuk membuat tabel Delta dalam database Glue dan database memiliki properti kosong:LOCATION
IllegalArgumentException: Can not create a Path from an empty string
Untuk mengatasi masalah ini, buat database di Katalog Data dengan jalur yang valid dan tidak kosong untuk
LOCATION
bidang tersebut. Untuk langkah-langkah menerapkan solusi ini, lihat Pengecualian argumen ilegal saat membuat tabel di Panduan Pengguna Amazon Athena.