Kesalahan EMR cluster Amazon: kesalahan faktor HDFS replikasi - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kesalahan EMR cluster Amazon: kesalahan faktor HDFS replikasi

Saat Anda menghapus node inti dari grup instans inti atau armada instance, Amazon EMR mungkin mengalami kesalahan HDFS replikasi. Kesalahan ini terjadi ketika Anda menghapus node inti dan jumlah node inti berada di bawah faktor dfs.replication yang dikonfigurasi untuk Hadoop Distributed File System (). HDFS Dengan demikian, Amazon tidak EMR dapat melakukan operasi dengan aman. Untuk menentukan nilai default dfs.replication konfigurasi, HDFSkonfigurasi.

Kemungkinan penyebab

Lihat berikut ini untuk kemungkinan penyebab kesalahan faktor HDFS replikasi:

Solusi dan praktik terbaik

Lihat berikut ini untuk solusi dan praktik terbaik:

  • Saat Anda mengubah ukuran EMR cluster Amazon secara manual, jangan turunkan di bawah dfs.replication karena Amazon tidak EMR dapat menyelesaikan pengubahan ukuran dengan aman.

  • Saat Anda menggunakan penskalaan terkelola atau penskalaan otomatis, pastikan kapasitas minimum klaster Anda tidak lebih rendah dari faktornya. dfs.replication

  • Jumlah instance inti harus setidaknya dfs.replication ditambah satu. Ini memastikan bahwa Amazon EMR dapat berhasil mengganti node inti yang tidak sehat jika Anda mengaktifkan penggantian inti yang tidak sehat.

penting

Kegagalan node inti tunggal dapat menyebabkan hilangnya HDFS data jika Anda mengatur dfs.replication ke 1. Jika klaster Anda memiliki HDFS penyimpanan, sebaiknya Anda mengonfigurasi klaster dengan setidaknya empat node inti untuk beban kerja produksi guna menghindari kehilangan data dan juga menetapkan dfs.replication faktor minimal 2.