Tautan ke Amazon EMR tentang panduan praktik EKS terbaik di GitHub - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Tautan ke Amazon EMR tentang panduan praktik EKS terbaik di GitHub

Kami telah membuat Amazon EMR pada Panduan Praktik EKS Terbaik menggunakan kolaborasi komunitas open source sehingga kami dapat melakukan iterasi dengan cepat dan memberikan rekomendasi untuk aspek pembuatan dan menjalankan klaster virtual. Kami menyarankan Anda menggunakan panduan praktik EKS terbaik EMR Amazon untuk bagian tersebut. Pilih tautan di setiap bagian untuk pergi ke GitHub situs.

Keamanan

catatan

Untuk informasi selengkapnya tentang keamanan dengan EMR AmazonEKS, lihatPraktik terbaik keamanan Amazon EMR di EKS.

Praktik terbaik enkripsi: cara menggunakan enkripsi untuk data saat istirahat dan dalam perjalanan.

Mengelola keamanan jaringan menjelaskan cara mengonfigurasi grup keamanan untuk pod untuk EMR Amazon EKS saat Anda terhubung ke sumber data yang di-host Layanan AWS seperti Amazon RDS dan Amazon Redshift.

Menggunakan manajer AWS rahasia untuk menyimpan rahasia.

Pengajuan pekerjaan Pyspark

Pengajuan pekerjaan Pyspark: menentukan berbagai jenis kemasan untuk pySpark aplikasi menggunakan format kemasan seperti zip, telur, roda, dan pex.

Penyimpanan

Menggunakan EBS volume:: cara menggunakan penyediaan statis dan dinamis untuk pekerjaan yang membutuhkan EBS volume.

Menggunakan Amazon FSx untuk volume Lustre: cara menggunakan penyediaan statis dan dinamis untuk pekerjaan yang membutuhkan Amazon FSx untuk volume Luster.

Menggunakan volume penyimpanan Instance: cara menggunakan volume penyimpanan instance untuk pemrosesan pekerjaan.

Integrasi metastore

Menggunakan metastore Hive: menawarkan berbagai cara untuk menggunakan metastore Hive.

Menggunakan AWS Glue: menawarkan berbagai cara untuk mengkonfigurasi katalog AWS Glue.

Debugging

Menggunakan debugging Spark: cara mengubah level log.

Menghubungkan ke Spark UI pada pod driver.

Cara menggunakan server riwayat Spark yang dihosting sendiri dengan Amazon EMR aktif. EKS

Memecahkan masalah Amazon EMR tentang masalah EKS

Pemecahan masalah.

Penempatan simpul

Menggunakan pemilih node Kubernetes untuk single-az dan kasus penggunaan lainnya.

Menggunakan penempatan simpul Fargate.

Kinerja

Menggunakan Alokasi Sumber Daya Dinamis (DRA).

EKSpraktik terbaik untuk plugin Amazon VPC Container Network Interface (CNI), Cluster Autoscaler, dan Core. DNS

Optimalisasi Biaya

Menggunakan instans spot: Praktik terbaik instans EC2 spot Amazon dan cara menggunakan fitur dekomisi simpul Spark.

Menggunakan AWS Outposts

Menjalankan EMR Amazon saat EKS menggunakan AWS Outposts