Melihat antarmuka web yang di-host pada klaster Amazon EMR - Amazon EMR

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Melihat antarmuka web yang di-host pada klaster Amazon EMR

penting

Anda dapat mengonfigurasi grup keamanan kustom untuk mengizinkan akses masuk ke antarmuka web ini. Perlu diingat bahwa setiap port tempat Anda mengizinkan lalu lintas masuk merupakan potensi kelemahan keamanan. Cermatlah dalam meninjau grup keamanan kustom untuk memastikan bahwa Anda meminimalisir kelemahan. Untuk informasi selengkapnya, lihat Kontrol lalu lintas jaringan dengan grup keamanan untuk klaster EMR Amazon Anda.

Hadoop dan aplikasi lain yang Anda instal di kluster EMR Anda mempublikasikan antarmuka pengguna sebagai situs web yang di-host di node utama. Untuk alasan keamanan, saat menggunakan Grup Keamanan Terkelola Amazon EMR, situs web ini hanya tersedia di server web lokal node utama. Untuk alasan itu, Anda perlu terhubung ke node utama untuk melihat antarmuka web. Untuk informasi selengkapnya, lihat Connect ke node primer Amazon EMR cluster menggunakan SSH. Hadoop juga menerbitkan antarmuka pengguna sebagai situs web yang di-host pada simpul inti dan tugas. Situs web tersebut juga hanya tersedia di server web lokal pada simpul.

Tabel berikut ini mencantumkan antarmuka web yang dapat Anda lihat pada instans klaster. Antarmuka Hadoop ini tersedia pada semua klaster. Untuk antarmuka instance master, ganti master-public-dns-name dengan DNS publik Master yang tercantum di tab Ringkasan cluster di konsol EMR Amazon. Untuk antarmuka inti dan instance tugas, ganti coretask-public-dns-name dengan nama DNS Publik yang terdaftar untuk instance. Untuk menemukan nama DNS Publik instans, di konsol EMR Amazon, pilih klaster Anda dari daftar, pilih tab Perangkat Keras, pilih ID grup instans yang berisi instance yang ingin Anda sambungkan, lalu catat nama DNS Publik yang terdaftar untuk instance tersebut.

Nama antarmuka

URI

Server riwayat Flink (EMR versi 5.33 dan yang lebih baru) http: //:8082/ master-public-dns-name
Ganglia http:///ganglia/master-public-dns-name
Hadoop HDFS (versi NameNode EMR pra-6.x) https: //:50470/ master-public-dns-name
Hadoop HDFS NameNode http: //:50070/ master-public-dns-name
Hadoop HDFS DataNode http: //:50075/ coretask-public-dns-name
Hadoop HDFS ( NameNode EMR versi 6.x) https: //:9870/ master-public-dns-name
Hadoop HDFS (versi DataNode EMR pra-6.x) https: //:50475/ coretask-public-dns-name
Hadoop HDFS ( DataNode EMR versi 6.x) https: //:9865/ coretask-public-dns-name
HBase http: //:16010/ master-public-dns-name
Hue http: //:8888/ master-public-dns-name
JupyterHub https: //:9443/ master-public-dns-name
Livy http: //:8998/ master-public-dns-name
Percikan HistoryServer http: //:18080/ master-public-dns-name
Tez http: //:8080/tez-ui master-public-dns-name
BENANG NodeManager http: //:8042/ coretask-public-dns-name
BENANG ResourceManager http: //:8088/ master-public-dns-name
Zeppelin http: //:8890/ master-public-dns-name

Karena ada beberapa antarmuka khusus aplikasi yang tersedia di simpul utama yang tidak tersedia pada node inti dan tugas, instruksi dalam dokumen ini khusus untuk simpul primer Amazon EMR. Mengakses antarmuka web pada inti dan node tugas dapat dilakukan dengan cara yang sama seperti Anda akan mengakses antarmuka web pada node utama.

Ada beberapa cara Anda dapat mengakses antarmuka web pada node utama. Metode termudah dan tercepat adalah menggunakan SSH untuk terhubung ke node utama dan menggunakan browser berbasis teks, Lynx, untuk melihat situs web di klien SSH Anda. Namun, Lynx adalah peramban berbasis teks dengan antarmuka pengguna terbatas yang tidak dapat menampilkan grafis. Contoh berikut menunjukkan cara membuka ResourceManager antarmuka Hadoop menggunakan Lynx (Lynx juga URLs disediakan ketika Anda masuk ke node utama menggunakan SSH).

lynx http://ip-###-##-##-###.us-west-2.compute.internal:8088/

Ada dua opsi yang tersisa untuk mengakses antarmuka web pada node utama yang menyediakan fungsionalitas browser penuh. Pilih salah satu cara berikut:

  • Opsi 1 (direkomendasikan untuk pengguna yang lebih teknis): Gunakan klien SSH untuk terhubung ke node utama, konfigurasikan tunneling SSH dengan penerusan port lokal, dan gunakan browser Internet untuk membuka antarmuka web yang dihosting di node utama. Metode ini memungkinkan Anda untuk mengonfigurasi akses antarmuka web tanpa menggunakan proksi SOCKS.

  • Opsi 2 (direkomendasikan untuk pengguna baru): Gunakan klien SSH untuk terhubung ke node utama, konfigurasikan tunneling SSH dengan penerusan port dinamis, dan konfigurasikan browser Internet Anda untuk menggunakan add-on seperti untuk Firefox atau Chrome FoxyProxy SwitchyOmega untuk mengelola pengaturan proxy SOCKS Anda. Metode ini memungkinkan Anda secara otomatis memfilter URLs berdasarkan pola teks dan membatasi pengaturan proxy ke domain yang cocok dengan bentuk nama DNS node utama. Untuk informasi selengkapnya tentang cara mengonfigurasi FoxyProxy Firefox dan Google Chrome, lihatOpsi 2, bagian 2: Konfigurasikan pengaturan proxy untuk melihat situs web yang dihosting di simpul utama klaster EMR Amazon.

catatan

Jika Anda memodifikasi port tempat aplikasi berjalan melalui konfigurasi cluster, hyperlink ke port tidak akan diperbarui di konsol EMR Amazon. Ini karena konsol tidak memiliki fungsi untuk membaca server.port konfigurasi.

Dengan Amazon EMR versi 5.25.0 atau yang lebih baru, Anda dapat mengakses UI server riwayat Spark dari konsol tanpa mengatur proksi web melalui koneksi SSH. Untuk informasi selengkapnya, lihat Akses satu klik ke server riwayat Spark persisten.