Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Opsi penskalaan klaster untuk kluster Amazon EMR
catatan
Opsi perilaku penskalaan tidak lagi didukung sejak Amazon EMR merilis 5.10.0. Karena pengenalan penagihan per detik di AmazonEC2, perilaku penurunan skala default untuk klaster EMR Amazon sekarang dihentikan pada penyelesaian tugas.
Dengan Amazon EMR merilis 5.1.0 hingga 5.9.1, ada dua opsi untuk perilaku penurunan skala: hentikan pada batas jam instans untuk penagihan Amazon, atau akhiri saat penyelesaian tugas. EC2 Dimulai dengan EMR rilis Amazon 5.10.0, pengaturan untuk penghentian pada batas jam instans tidak digunakan lagi karena pengenalan penagihan per detik di Amazon. EC2 Kami tidak merekomendasikan menentukan pengakhiran batas jam instans dalam versi yang memiliki opsi tersebut.
Awas
Jika Anda menggunakan AWS CLI untuk mengeluarkan modify-instance-groups
denganEC2InstanceIdsToTerminate
, instance ini segera dihentikan, tanpa mempertimbangkan pengaturan ini, dan terlepas dari status aplikasi yang berjalan di dalamnya. Mengakhiri sebuah instans dengan cara ini berisiko kehilangan data dan perilaku klaster tak terduga.
Saat penghentian saat penyelesaian tugas ditentukan, Amazon EMR menolak daftar dan menguras tugas dari node sebelum menghentikan instance Amazon. EC2 Dengan salah satu perilaku yang ditentukan, Amazon EMR tidak menghentikan EC2 instans Amazon di grup instans inti jika dapat menyebabkan HDFS korupsi.
Akhiri pada penyelesaian tugas
Amazon EMR memungkinkan Anda menurunkan skala klaster Anda tanpa memengaruhi beban kerja Anda. Amazon EMR dengan anggun menonaktifkan, YARNHDFS, dan daemon lainnya pada node inti dan tugas selama operasi pengubahan ukuran tanpa kehilangan data atau mengganggu pekerjaan. Amazon EMR hanya mengurangi ukuran grup instans jika pekerjaan yang ditetapkan ke grup telah selesai dan mereka tidak aktif. Untuk YARN NodeManager Graceful Decommission, Anda dapat secara manual menyesuaikan waktu node menunggu untuk dinonaktifkan.
Kali ini diatur menggunakan properti di klasifikasi konfigurasi YARN-site
. Menggunakan Amazon EMR release 5.12.0 dan yang lebih tinggi, tentukan properti. YARN.resourcemanager.nodemanager-graceful-decommission-timeout-secs
Menggunakan EMR rilis Amazon sebelumnya, tentukan YARN.resourcemanager.decommissioning.timeout
properti.
Jika masih ada kontainer atau YARN aplikasi yang berjalan saat batas waktu penonaktifan berlalu, node dipaksa untuk dinonaktifkan dan menjadwalkan YARN ulang kontainer yang terpengaruh pada node lain. Nilai default adalah 3600 detik (satu jam). Anda dapat mengatur batas waktu ini menjadi nilai tinggi yang sewenang-wenang untuk memaksa pengurangan anggun menunggu lebih lama. Untuk informasi selengkapnya, lihat Graceful Decommission of YARN nodes dalam dokumentasi
Grup simpul tugas
Amazon EMR secara cerdas memilih instance yang tidak memiliki tugas yang berjalan terhadap langkah atau aplikasi apa pun, dan menghapus instance tersebut dari klaster terlebih dahulu. Jika semua instance di cluster sedang digunakan, Amazon EMR menunggu tugas diselesaikan pada instance sebelum menghapusnya dari cluster. Waktu tunggu default adalah 1 jam. Nilai ini dapat diubah dengan YARN.resourcemanager.decommissioning.timeout
pengaturan. Amazon EMR secara dinamis menggunakan pengaturan baru. Anda dapat menyetel ini ke jumlah besar yang sewenang-wenang untuk memastikan bahwa Amazon EMR tidak menghentikan tugas apa pun sekaligus mengurangi ukuran cluster.
Grup simpul inti
Pada node inti, keduanya YARN NodeManager dan HDFS DataNode daemon harus dinonaktifkan agar grup instance dapat dikurangi. UntukYARN, pengurangan anggun memastikan bahwa node yang ditandai untuk penonaktifan hanya dialihkan ke DECOMMISSIONED
status jika tidak ada wadah atau aplikasi yang tertunda atau tidak lengkap. Penonaktifan segera selesai jika tidak ada kontainer yang berjalan pada simpul di awal penonaktifan.
UntukHDFS, pengurangan anggun memastikan bahwa kapasitas target HDFS cukup besar untuk memenuhi semua blok yang ada. Jika kapasitas target tidak cukup besar, hanya sebagian instance inti yang dinonaktifkan sehingga node yang tersisa dapat menangani data saat ini yang berada di dalamnya. HDFS Anda harus memastikan HDFS kapasitas tambahan untuk memungkinkan penonaktifan lebih lanjut. Anda juga harus mencoba meminimalkan penulisan I/O sebelum mencoba mengurangi grup instance. I/O tulis yang berlebihan mungkin menunda penyelesaian operasi pengubahan ukuran.
Batas lain adalah faktor replikasi default, dfs.replication
di dalam /etc/hadoop/conf/hdfs-site
. Saat membuat cluster, Amazon EMR mengonfigurasi nilai berdasarkan jumlah instance di cluster: 1
dengan 1-3 instance, untuk cluster dengan 4-9 instance, dan 2
3
untuk cluster dengan 10+ instance.
Awas
-
Pengaturan
dfs.replication
ke 1 pada cluster dengan kurang dari empat node dapat menyebabkan hilangnya HDFS data jika satu node turun. Kami menyarankan Anda menggunakan cluster dengan setidaknya empat node inti untuk beban kerja produksi. -
Amazon tidak EMR akan mengizinkan cluster untuk menskalakan node inti di bawah ini
dfs.replication
. Misalnya, jikadfs.replication = 2
, jumlah minimum node inti adalah 2. -
Saat Anda menggunakan Penskalaan Terkelola, Penskalaan Otomatis, atau memilih untuk mengubah ukuran klaster secara manual, sebaiknya atur
dfs.replication
ke 2 atau lebih tinggi.
Pengurangan yang anggun tidak memungkinkan Anda mengurangi node inti di bawah faktor HDFS replikasi. Ini untuk memungkinkan HDFS untuk menutup file karena replika tidak mencukupi. Untuk menghindari batas ini, turunkan faktor replikasi dan restart daemon. NameNode