Resumen de los puntos de conexión interactivos - Amazon EMR

Resumen de los puntos de conexión interactivos

Un punto de conexión interactivo proporciona la capacidad para que clientes interactivos como Amazon EMR Studio se conecten a clústeres de Amazon EMR en EKS para ejecutar cargas de trabajo interactivas. El punto de conexión interactivo está respaldado por una puerta de enlace de Jupyter Enterprise que proporciona la capacidad de administración remota del ciclo de vida de los kernels que necesitan los clientes interactivos. Los kernels son procesos específicos del lenguaje que interactúan con el cliente de Amazon EMR Studio basado en Jupyter para ejecutar cargas de trabajo interactivas.

Los puntos de conexión interactivos admiten los siguientes kernels:

  • Python 3

  • PySpark en Kubernetes

  • Apache Spark con Scala

nota

Los precios de Amazon EMR en EKS se aplican a los kernels y puntos de conexión interactivos. Para obtener más información, consulte la página Precios de Amazon EMR en EKS.

Se requieren las siguientes entidades para que EMR Studio se conecte con Amazon EMR en EKS.

  • Clúster virtual en Amazon EMR en EKS: un clúster virtual es un espacio de nombres de Kubernetes con el que registra Amazon EMR. Amazon EMR utiliza clústeres virtuales para ejecutar trabajos y alojar puntos de conexión. Puede respaldar varios clústeres virtuales con el mismo clúster físico. Sin embargo, cada clúster virtual se asigna a un espacio de nombres de un clúster de Amazon EKS. Los clústeres virtuales no crean ningún recurso activo que contribuya a su factura o que requiera una administración del ciclo de vida externa al servicio.

  • Punto de conexión interactivo de Amazon EMR en EKS: un punto de conexión interactivo es un punto de conexión HTTPS al que los usuarios de EMR Studio pueden conectar un espacio de trabajo. Solo puede acceder a los puntos de conexión HTTPS desde EMR Studio y crearlos en una subred privada de Amazon Virtual Private Cloud (Amazon VPC) para su clúster de Amazon EKS.

    Los kernels de Python, PySpark y Spark Scala utilizan los permisos definidos en su rol de ejecución de trabajos de Amazon EMR en EKS para invocar otros Servicios de AWS. Todos los kernels y usuarios que se conectan al punto de conexión interactivo utilizan el rol que usted especificó al crear el punto de conexión. Le recomendamos que cree puntos de conexión independientes para los distintos usuarios, y que estos últimos tengan roles de AWS Identity and Access Management (IAM) diferentes.

  • Controlador de equilibrador de carga de aplicación de AWS: el controlador de equilibrador de carga de aplicación de AWS administra el Elastic Load Balancing para un clúster de Amazon EKS Kubernetes. El controlador proporciona un equilibrador de carga de aplicación (ALB) al crear un recurso de Kubernetes Ingress. Un ALB expone un servicio de Kubernetes, como un punto de conexión interactivo, fuera del clúster de Amazon EKS, pero dentro de la misma Amazon VPC. Al crear un punto de conexión interactivo, también se implementa un recurso de Ingress que expone el punto de conexión interactivo mediante el ALB para que los clientes interactivos puedan conectarse a él. Solo necesita instalar un controlador de equilibrador de carga de aplicación de AWS para cada clúster de Amazon EKS.

En el siguiente diagrama, se muestra la arquitectura de puntos de conexión interactivos de Amazon EMR en EKS. Un clúster de Amazon EKS comprende la computación para ejecutar las cargas de trabajo analíticas y el punto de conexión interactivo. El controlador de equilibrador de carga de aplicación se ejecuta en el espacio de nombres kube-system; las cargas de trabajo y los puntos de conexión interactivos se ejecutan en el espacio de nombres que especifique al crear el clúster virtual. Al crear un punto de conexión interactivo, el plano de control de Amazon EMR en EKS crea la implementación del punto de conexión interactivo en el clúster de Amazon EKS. Además, el controlador del equilibrador de carga de AWS crea una instancia de entrada al equilibrador de carga de aplicación. El equilibrador de carga de aplicación proporciona la interfaz externa para que clientes como EMR Studio se conecten al clúster de Amazon EMR y ejecuten cargas de trabajo interactivas.

Diagrama de la arquitectura de puntos de conexión interactivos