Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Pertimbangan dan batasan saat menggunakan konektor Spark
Konektor Spark mendukung berbagai cara untuk mengelola kredensil, untuk mengkonfigurasi keamanan, dan untuk terhubung dengan layanan lain. AWS Biasakan diri dengan rekomendasi dalam daftar ini untuk mengkonfigurasi koneksi fungsional dan tangguh.
-
Kami menyarankan Anda mengaktifkan SSL untuk koneksi JDBC dari Spark di Amazon EMR ke Amazon Redshift.
-
Kami menyarankan Anda mengelola kredensil untuk cluster Amazon Redshift sebagai praktik AWS Secrets Manager terbaik. Lihat Menggunakan AWS Secrets Manager untuk mengambil kredensil untuk menghubungkan ke Amazon Redshift sebagai contoh.
-
Kami menyarankan Anda meneruskan peran IAM dengan parameter
aws_iam_role
untuk parameter autentikasi Amazon Redshift. -
Parameter
tempformat
saat ini tidak mendukung format Parket. -
tempdir
URI menunjuk ke lokasi Amazon S3. Direktori temp ini tidak dibersihkan secara otomatis dan karenanya dapat menambah biaya tambahan. -
Pertimbangkan rekomendasi berikut untuk Amazon Redshift:
-
Kami menyarankan Anda memblokir akses publik ke cluster Amazon Redshift.
-
Kami menyarankan Anda mengaktifkan pencatatan audit Amazon Redshift.
-
Sebaiknya aktifkan enkripsi saat istirahat Amazon Redshift.
-
-
Pertimbangkan rekomendasi berikut untuk Amazon S3:
-
Kami merekomendasikan untuk memblokir akses publik ke bucket Amazon S3.
-
Kami menyarankan Anda menggunakan enkripsi sisi server Amazon S3 untuk mengenkripsi bucket S3 yang Anda gunakan.
-
Sebaiknya gunakan kebijakan siklus hidup Amazon S3 untuk menentukan aturan retensi bucket S3.
-
Amazon EMR selalu memverifikasi kode yang diimpor dari sumber terbuka ke dalam gambar. Demi keamanan, kami tidak mendukung kunci AWS akses encoding di
tempdir
URI sebagai metode otentikasi dari Spark ke Amazon S3.
-
Untuk informasi selengkapnya tentang penggunaan konektor dan parameter yang didukung, lihat sumber daya berikut:
-
Integrasi Amazon Redshift untuk Apache Spark di Panduan Manajemen Amazon Redshift
-
Repositori
spark-redshift
komunitasdi Github