Ver las interfaces web alojadas en clústeres de Amazon EMR

importante

Es posible configurar un grupo de seguridad personalizado para permitir el acceso entrante a estas interfaces web. Tenga en cuenta que cualquier puerto en el que permita el tráfico entrante representa una posible vulnerabilidad de seguridad. Revise con atención los grupos de seguridad personalizados para asegurarse de minimizar las vulnerabilidades. Para obtener más información, consulte Control del tráfico de red con grupos de seguridad para su clúster de Amazon EMR.

Hadoop y otras aplicaciones que instale en el clúster de EMR, publican interfaces de usuario como sitios web alojados en el nodo principal. Por motivos de seguridad, cuando se utilizan grupos de seguridad administrados de Amazon EMR, estos sitios web solo están disponibles en el servidor web local del nodo principal. Por ese motivo, debe conectarse al nodo principal para ver las interfaces web. Para obtener más información, consulte Conexión al nodo principal del clúster de Amazon EMR mediante SSH. Hadoop también publica las interfaces de usuario como sitios web alojados en los nodos secundarios y de tareas. Estos sitios web también se encuentran disponibles solo en servidores web locales en los nodos.

En la tabla siguiente, se muestran las interfaces web que puede ver en las instancias de clúster. Estas interfaces de Hadoop están disponibles en todos los clústeres. Para las interfaces de la instancia maestra, master-public-dns-name sustitúyalas por el DNS público maestro que aparece en la pestaña Resumen del clúster de la consola de Amazon EMR. Para las interfaces de instancias principales y de tareas, coretask-public-dns-name sustitúyalas por el nombre de DNS público que aparece en la lista de la instancia. Para buscar el nombre DNS público de una instancia, vaya a la consola de Amazon EMR, seleccione el clúster en la lista, seleccione la pestaña Hardware, seleccione el ID del grupo de instancias que contiene la instancia a la que desea conectarse y, a continuación, anote el nombre DNS público que aparece para la instancia.

Nombre de interfaz	URI
Servidor del historial de Flink (versión 5.33 y posteriores de EMR)	http: //:8082/ `master-public-dns-name`
Ganglia	http:///ganglia/ `master-public-dns-name`
Hadoop HDFS (versión NameNode EMR anterior a la 6.x)	http: `master-public-dns-name` //:50070/
Hadoop HDFS (versión NameNode EMR anterior a la 6.x)	`master-public-dns-name`https://:50470/
Hadoop HDFS ( NameNode EMR versión 6.x)	http: `master-public-dns-name` //:9870/
Hadoop HDFS ( NameNode EMR versión 6.x)	`master-public-dns-name`https://:9871/
Hadoop HDFS (versión DataNode EMR anterior a la 6.x)	http: `coretask-public-dns-name` //:50075/
Hadoop HDFS (versión DataNode EMR anterior a la 6.x)	`coretask-public-dns-name`https://:50475/
Hadoop HDFS ( DataNodeEMR versión 6.x)	http: `coretask-public-dns-name` //:9864/
Hadoop HDFS ( DataNode EMR versión 6.x)	https: `coretask-public-dns-name` //:9865/
HBase	http: //:16010/ `master-public-dns-name`
Hue	http: //:8888/ `master-public-dns-name`
JupyterHub	https: //:9443/ `master-public-dns-name`
Livy	http: //:8998/ `master-public-dns-name`
Chispa HistoryServer	http: //:18080/ `master-public-dns-name`
Tez	http://: -ui `master-public-dns-name` 8080/tez
HILO NodeManager	http: //:8042/ `coretask-public-dns-name`
HILO ResourceManager	http: //:8088/ `master-public-dns-name`
Zeppelin	http: //:8890/ `master-public-dns-name`

Dado que hay varias interfaces específicas de aplicación disponibles en el nodo principal que no están disponibles en los nodos secundarios y de tarea, las instrucciones en este documento son específicas del nodo principal de Amazon EMR. El acceso a las interfaces web en los nodos secundarios y de tarea puede realizarse de la misma manera en que se accedería a las interfaces web en el nodo principal.

Existen varias formas en las que puede acceder a las interfaces web en el nodo principal. El método más rápido y más sencillo consiste en utilizar SSH para conectarse al nodo principal y utilizar el navegador basado en texto, Lynx, para ver los sitios web en su cliente SSH. Sin embargo, Lynx es un navegador basado en texto con una interfaz de usuario limitada que no puede mostrar gráficos. El siguiente ejemplo muestra cómo abrir la ResourceManager interfaz de Hadoop mediante Lynx (las direcciones URL de Lynx también se proporcionan al iniciar sesión en el nodo principal mediante SSH).


lynx http://ip-###-##-##-###.us-west-2.compute.internal:8088/

Existen dos opciones restantes para acceder a las interfaces web en el nodo principal que proporcionan una funcionalidad del navegador completa. Seleccione una de las siguientes opciones:

Opción 1 (recomendada para usuarios más técnicos): utilice un cliente SSH para conectarse al nodo principal, configure el túnel SSH con enrutamiento de puertos local y utilice un navegador de Internet para abrir interfaces web alojadas en el nodo principal. Este método le permite configurar el acceso a la interfaz web sin usar un proxy SOCKS.
Opción 2 (recomendada para nuevos usuarios): utilice un cliente SSH para conectarse al nodo principal, configure la tunelización SSH con un reenvío dinámico de puertos y configure su navegador de Internet FoxyProxy para que utilice un complemento, como Firefox o Chrome, a fin de administrar la configuración del proxy SOCKS. SwitchyOmega Este método le permite filtrar automáticamente las URL en función de los patrones de texto y limitar la configuración del proxy a dominios que coinciden con la forma del nombre de DNS del nodo principal. Para obtener más información sobre cómo configurar FoxyProxy Firefox y Google Chrome, consulte. Opción 2, parte 2: configurar ajustes de proxy para ver sitios web alojados en el nodo principal del clúster de Amazon EMR

nota

Si modifica el puerto en el que se ejecuta una aplicación mediante la configuración de clúster, el hipervínculo al puerto no se actualizará en la consola de Amazon EMR. Esto se debe a que la consola no tiene la funcionalidad de leer la configuración de server.port.

Con Amazon EMR versión 5.25.0 o posterior, puede acceder a la interfaz de usuario del servidor del historial de Spark desde la consola sin configurar un proxy web a través de una conexión SSH. Para obtener más información, consulta el One-clickacceso al servidor de historial persistente de Spark.

Temas

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Puertos de servicio de Amazon EMR

Opción 1: configurar un túnel SSH al nodo principal de Amazon EMR utilizando el enrutamiento de puertos local