Ver las interfaces web alojadas en clústeres de Amazon EMR - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ver las interfaces web alojadas en clústeres de Amazon EMR

importante

Es posible configurar un grupo de seguridad personalizado para permitir el acceso entrante a estas interfaces web. Tenga en cuenta que cualquier puerto en el que permita el tráfico entrante representa una posible vulnerabilidad de seguridad. Revise con atención los grupos de seguridad personalizados para asegurarse de minimizar las vulnerabilidades. Para obtener más información, consulte Control del tráfico de red con grupos de seguridad para su clúster de Amazon EMR.

Hadoop y otras aplicaciones que instale en el clúster de EMR, publican interfaces de usuario como sitios web alojados en el nodo principal. Por motivos de seguridad, cuando se utilizan grupos de seguridad administrados de Amazon EMR, estos sitios web solo están disponibles en el servidor web local del nodo principal. Por ese motivo, debe conectarse al nodo principal para ver las interfaces web. Para obtener más información, consulte Conexión al nodo principal del clúster de Amazon EMR mediante SSH. Hadoop también publica las interfaces de usuario como sitios web alojados en los nodos secundarios y de tareas. Estos sitios web también se encuentran disponibles solo en servidores web locales en los nodos.

En la tabla siguiente, se muestran las interfaces web que puede ver en las instancias de clúster. Estas interfaces de Hadoop están disponibles en todos los clústeres. Para las interfaces de la instancia maestra, master-public-dns-name sustitúyalas por el DNS público maestro que aparece en la pestaña Resumen del clúster de la consola de Amazon EMR. Para las interfaces de instancias principales y de tareas, coretask-public-dns-name sustitúyalas por el nombre de DNS público que aparece en la lista de la instancia. Para buscar el nombre DNS público de una instancia, vaya a la consola de Amazon EMR, seleccione el clúster en la lista, seleccione la pestaña Hardware, seleccione el ID del grupo de instancias que contiene la instancia a la que desea conectarse y, a continuación, anote el nombre DNS público que aparece para la instancia.

Nombre de interfaz

URI

Servidor del historial de Flink (versión 5.33 y posteriores de EMR) http: //:8082/ master-public-dns-name
Ganglia http://ganglia/ master-public-dns-name
Hadoop HDFS (versión NameNode EMR anterior a la 6.x) master-public-dns-namehttps://:50470/
Hadoop HDFS NameNode http: //:50070/ master-public-dns-name
Hadoop HDFS DataNode http: //:50075/ coretask-public-dns-name
Hadoop HDFS ( NameNode EMR versión 6.x) master-public-dns-namehttps://:9870/
Hadoop HDFS (versión DataNode EMR anterior a la 6.x) coretask-public-dns-namehttps://:50475/
Hadoop HDFS ( DataNode EMR versión 6.x) https: coretask-public-dns-name //:9865/
HBase http: //:16010/ master-public-dns-name
Hue http: //:8888/ master-public-dns-name
JupyterHub https://:9443/ master-public-dns-name
Livy http: //:8998/ master-public-dns-name
Chispa HistoryServer http: //:18080/ master-public-dns-name
Tez http://:8080/tez-ui master-public-dns-name
HILO NodeManager http: //:8042/ coretask-public-dns-name
HILO ResourceManager http: //:8088/ master-public-dns-name
Zeppelin http: //:8890/ master-public-dns-name

Dado que hay varias interfaces específicas de aplicación disponibles en el nodo principal que no están disponibles en los nodos secundarios y de tarea, las instrucciones en este documento son específicas del nodo principal de Amazon EMR. El acceso a las interfaces web en los nodos secundarios y de tarea puede realizarse de la misma manera en que se accedería a las interfaces web en el nodo principal.

Existen varias formas en las que puede acceder a las interfaces web en el nodo principal. El método más rápido y más sencillo consiste en utilizar SSH para conectarse al nodo principal y utilizar el navegador basado en texto, Lynx, para ver los sitios web en su cliente SSH. Sin embargo, Lynx es un navegador basado en texto con una interfaz de usuario limitada que no puede mostrar gráficos. El siguiente ejemplo muestra cómo abrir la ResourceManager interfaz de Hadoop mediante Lynx (los Lynx también URLs se proporcionan al iniciar sesión en el nodo principal mediante SSH).

lynx http://ip-###-##-##-###.us-west-2.compute.internal:8088/

Existen dos opciones restantes para acceder a las interfaces web en el nodo principal que proporcionan una funcionalidad del navegador completa. Seleccione una de las siguientes opciones:

  • Opción 1 (recomendada para usuarios más técnicos): utilice un cliente SSH para conectarse al nodo principal, configure el túnel SSH con enrutamiento de puertos local y utilice un navegador de Internet para abrir interfaces web alojadas en el nodo principal. Este método le permite configurar el acceso a la interfaz web sin usar un proxy SOCKS.

  • Opción 2 (recomendada para nuevos usuarios): utilice un cliente SSH para conectarse al nodo principal, configure la tunelización SSH con un reenvío dinámico de puertos y configure su navegador de Internet FoxyProxy para que utilice un complemento, como Firefox o Chrome, a fin de administrar la configuración del proxy SOCKS. SwitchyOmega Este método te permite filtrar automáticamente en URLs función de los patrones de texto y limitar la configuración del proxy a los dominios que coincidan con la forma del nombre DNS del nodo principal. Para obtener más información sobre cómo configurar FoxyProxy Firefox y Google Chrome, consulteOpción 2, parte 2: configurar ajustes de proxy para ver sitios web alojados en el nodo principal del clúster de Amazon EMR.

nota

Si modifica el puerto en el que se ejecuta una aplicación mediante la configuración de clúster, el hipervínculo al puerto no se actualizará en la consola de Amazon EMR. Esto se debe a que la consola no tiene la funcionalidad de leer la configuración de server.port.

Con Amazon EMR versión 5.25.0 o posterior, puede acceder a la interfaz de usuario del servidor del historial de Spark desde la consola sin configurar un proxy web a través de una conexión SSH. Para obtener más información, consulte Acceso de un clic al servidor del historial de Spark persistente.