Asociar computación a un espacio de trabajo de EMR Studio - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Asociar computación a un espacio de trabajo de EMR Studio

Amazon EMR Studio ejecuta comandos de cuadernos mediante un kernel en un clúster de EMR. Antes de poder seleccionar un núcleo, debe adjuntar el Workspace a un clúster que utilice EC2 instancias de Amazon, a un clúster de Amazon EMR en EKS o a una aplicación EMR Serverless. EMR Studio le permite asociar espacios de trabajo a clústeres nuevos o existentes y le brinda la flexibilidad de cambiar los clústeres sin cerrar el espacio de trabajo.

En esta sección se cubren los temas siguientes, que le ayudarán a trabajar con clústeres de EMR Studio y aprovisionarlos:

Adjuntar un EC2 clúster de Amazon a un espacio de trabajo de EMR Studio

Puedes adjuntar un clúster de EMR que se ejecute en Amazon EC2 a un espacio de trabajo al crear el espacio de trabajo o adjuntar un clúster a un espacio de trabajo existente. Si desea crear y asociar un clúster nuevo, consulte Crear y asociar un nuevo clúster de EMR a un espacio de trabajo de EMR Studio.

nota

Un espacio de trabajo de Studio con la propagación de identidades de confianza de IAM Identity Center habilitada solo puede conectarse a un clúster de EMR con una configuración de seguridad que tenga Identity Center habilitado.

On create
Asociar un clúster de computación de Amazon EMR al crear un espacio de trabajo
  1. En el cuadro de diálogo Crear un espacio de trabajo, asegúrese de haber seleccionado una subred para el nuevo espacio de trabajo. Amplíe la sección Configuración avanzada.

  2. Seleccione Asociar espacio de trabajo a un clúster de EMR.

  3. En la lista desplegable de clústeres de EMR, seleccione un clúster de EMR existente para asociarlo al espacio de trabajo.

Tras asociar un clúster, termine de crear el espacio de trabajo. Cuando abra el nuevo espacio de trabajo por primera vez y seleccione el panel Clústeres de EMR, debería ver el clúster seleccionado asociado.

On launch
Asociar un clúster de computación de Amazon EMR al iniciar el espacio de trabajo
  1. Navegue hasta la lista de espacios de trabajo y seleccione la fila del espacio de trabajo que desee iniciar. A continuación, seleccione Iniciar espacio de trabajo > Iniciar con opciones.

  2. Seleccione un clúster de EMR para asociarlo al espacio de trabajo.

Tras asociar un clúster, termine de crear el espacio de trabajo. Cuando abra el nuevo espacio de trabajo por primera vez y seleccione el panel Clústeres de EMR, debería ver el clúster seleccionado asociado.

In JupyterLab
Adjunte un espacio de trabajo a un clúster de procesamiento de Amazon EMR en JupyterLab
  1. Seleccione su espacio de trabajo y, a continuación, seleccione Iniciar espacio de trabajo > Inicio rápido.

  2. En el interior JupyterLab, abre la pestaña Clúster en la barra lateral izquierda.

  3. Seleccione el menú desplegable EMR en el EC2 clúster o seleccione un clúster de Amazon EMR en EKS.

  4. Seleccione Asociar para asociar el clúster al espacio de trabajo.

Tras asociar el clúster, termine de crear el espacio de trabajo. Cuando abra el nuevo espacio de trabajo por primera vez y seleccione el panel Clústeres de EMR, debería ver el clúster seleccionado asociado.

In the Workspace UI
Asocie un espacio de trabajo a un clúster de computación de Amazon EMR desde la interfaz de usuario del espacio de trabajo
  1. En el espacio de trabajo que desee asociar a un clúster, elija el icono Clústeres de EMR en la barra lateral izquierda para abrir el panel Clúster.

  2. En Tipo de clúster, expanda el menú desplegable y seleccione Clúster de EMR activado. EC2

  3. Seleccione un clúster de la lista desplegable. Es posible que primero tenga que separar un clúster existente para habilitar la lista desplegable de selección del clúster.

  4. Elija Adjuntar. Cuando el clúster esté asociado, debería aparecer un mensaje de confirmación.

Asociar un clúster de Amazon EMR en EKS a un espacio de trabajo de EMR Studio

Además de utilizar clústeres de Amazon EMR que se ejecutan en Amazon EC2, puede adjuntar un Workspace a un clúster de Amazon EMR en EKS para ejecutar código de notebook. Para obtener más información sobre Amazon EMR en EKS, consulte Qué es Amazon EMR en EKS.

Para poder conectar un espacio de trabajo a un clúster de Amazon EMR en EKS, el administrador de Studio debe concederle permisos de acceso.

nota

No puede lanzar un clúster de Amazon EMR en EKS en un EMR Studio con la propagación de identidades de confianza de IAM Identity Center.

On create
Para asociar un clúster de Amazon EMR en EKS al crear un espacio de trabajo
  1. En el cuadro de diálogo Crear un espacio de trabajo, amplíe la sección Configuración avanzada.

  2. Seleccione Asociar espacio de trabajo a un clúster de Amazon EMR en EKS.

  3. En Clúster de Amazon EMR en EKS, elija un clúster de la lista desplegable.

  4. En Seleccione un punto de conexión, seleccione un punto de conexión administrado para asociarlo al espacio de trabajo. Un punto de conexión administrado es una puerta de enlace que permite a EMR Studio comunicarse con el clúster elegido.

  5. Seleccione Crear un espacio de trabajo para finalizar el proceso de creación del espacio de trabajo y asociar el clúster seleccionado.

Tras asociar un clúster, puede terminar el proceso de creación del espacio de trabajo. Cuando abra el nuevo espacio de trabajo por primera vez y seleccione el panel Clústeres de EMR, debería ver que el clúster seleccionado está asociado.

In the Workspace UI
Para asociar un espacio de trabajo a un clúster de Amazon EMR en EKS desde la interfaz de usuario del espacio de trabajo
  1. En el espacio de trabajo que desee asociar a un clúster, elija el icono Clústeres de EMR en la barra lateral izquierda para abrir el panel Clúster.

  2. Expanda el menú desplegable Tipo de clúster y seleccione Clústeres de EMR en EKS.

  3. En Clúster de EMR en EKS, seleccione un clúster de la lista desplegable.

  4. En Punto de conexión, seleccione un punto de conexión administrado para asociarlo al espacio de trabajo. Un punto de conexión administrado es una puerta de enlace que permite a EMR Studio comunicarse con el clúster elegido.

  5. Elija Adjuntar. Cuando el clúster esté asociado, debería aparecer un mensaje de confirmación.

Asociar una aplicación de Amazon EMR sin servidor a un espacio de trabajo de EMR Studio

Puede asociar un espacio de trabajo a una aplicación de EMR sin servidor para ejecutar cargas de trabajo interactivas. Para obtener más información, consulte Uso de cuadernos para ejecutar cargas de trabajo interactivas con EMR sin servidor a través de EMR Studio.

nota

No puede conectar una aplicación de EMR sin servidor a un EMR Studio con la propagación de identidades de confianza de IAM Identity Center.

ejemplo Adjunte un espacio de trabajo a una aplicación EMR sin servidor en JupyterLab

Para que pueda conectar un espacio de trabajo a una aplicación de EMR sin servidor, el administrador de su cuenta debe concederle los permisos de acceso, tal y como se describe en Required permissions for interactive workloads.

  1. Diríjase a EMR Studio, seleccione su espacio de trabajo y, a continuación, seleccione Iniciar espacio de trabajo > Inicio rápido.

  2. En el interior JupyterLab, abre la pestaña Clúster en la barra lateral izquierda.

  3. Seleccione EMR sin servidor como opción de computación y, a continuación, seleccione una aplicación de EMR sin servidor y un rol de tiempo de ejecución.

  4. Seleccione Asociar para asociar el clúster al espacio de trabajo.

Ahora, cuando abra este espacio de trabajo, debería ver la aplicación seleccionada que asoció.

Crear y asociar un nuevo clúster de EMR a un espacio de trabajo de EMR Studio

Los usuarios avanzados de EMR Studio pueden aprovisionar nuevos clústeres de EMR que se ejecuten en Amazon EC2 para usarlos con un espacio de trabajo. El nuevo clúster tiene todas las aplicaciones de macrodatos necesarias para EMR Studio instaladas de forma predeterminada.

Para crear clústeres, el administrador de Studio primero debe concederle el permiso mediante una política de sesión. Para obtener más información, consulte Creación de políticas de permisos para los usuarios de EMR Studio.

Puede crear un clúster nuevo en el cuadro de diálogo Crear un espacio de trabajo o desde el panel Clúster de la interfaz de usuario del espacio de trabajo. En cualquier caso, tiene dos opciones para crear un clúster:

  1. Crear un clúster de EMR: cree un clúster de EMR eligiendo el tipo y el recuento de EC2 instancias de Amazon.

  2. Utilizar una plantilla de clúster: aprovisione un clúster seleccionando una plantilla de clúster predefinida. Esta opción aparece si tiene permiso para usar plantillas de clúster.

    nota

    Si la propagación de identidades de confianza de IAM Identity Center está habilitada en el Studio, debe utilizar una plantilla para crear un clúster.

Para crear un clúster de EMR proporcionando una configuración de clúster
  1. Elija un punto de inicio.

    Para… Haga lo siguiente...
    Cree el clúster al crear un espacio de trabajo con el cuadro de diálogo Crear un espacio de trabajo. Amplíe la sección Configuración avanzada en el cuadro de diálogo Crear un espacio de trabajo y seleccione Crear un clúster de EMR.
    Cree el clúster desde el panel de clústeres de EMR en la interfaz de usuario del espacio de trabajo después de haber creado un espacio de trabajo. Elija la pestaña Clústeres de EMR en la barra lateral izquierda de un espacio de trabajo abierto, expanda la sección Configuración avanzada y elija Crear clúster.
  2. Ingrese un nombre de clúster. Asignar un nombre al clúster le ayudará a encontrarlo más adelante en la lista de clústeres de EMR Studio.

  3. En Versión de Amazon EMR, seleccione una versión de Amazon EMR para el clúster.

  4. Por ejemplo, selecciona el tipo y el número de EC2 instancias de Amazon para el clúster. Para obtener más información sobre la selección de los tipos de instancia, consulte Configurar los tipos de EC2 instancias de Amazon para utilizarlos con Amazon EMR. Se utilizará una instancia como nodo principal.

  5. Seleccione una subred en la que EMR Studio pueda lanzar el nuevo clúster. El administrador de Studio aprueba previamente cada opción de subred. Su espacio de trabajo debería poder conectarse a un clúster de cualquier subred de la lista.

  6. Seleccione un URI de S3 para el almacenamiento de registros.

  7. Seleccione Crear clúster de EMR para aprovisionarlo. Si usa el cuadro de diálogo Crear un espacio de trabajo, seleccione Crear un espacio de trabajo para crear el espacio de trabajo y aprovisionar el clúster. Una vez que EMR Studio aprovisione el nuevo clúster, lo asocia al espacio de trabajo.

Para crear un clúster mediante una plantilla de clúster
  1. Elija un punto de inicio.

    Para… Haga lo siguiente...
    Cree el clúster al crear un espacio de trabajo con el cuadro de diálogo Crear un espacio de trabajo. Expanda la sección Configuración avanzada en el cuadro de diálogo Crear un espacio de trabajo y seleccione Usar una plantilla de clúster.
    Cree el clúster desde el panel de clústeres de EMR en la interfaz de usuario del espacio de trabajo. Seleccione la pestaña Clústeres de EMR en la barra lateral izquierda de un espacio de trabajo abierto, expanda la sección Configuración avanzada y seleccione Plantilla de clúster.
  2. En la lista desplegable, seleccione una plantilla de clúster. Cada plantilla de clúster disponible incluye una breve descripción para ayudarle a realizar una selección.

  3. La plantilla de clúster que elija puede tener parámetros adicionales, como la versión de lanzamiento de Amazon EMR o el nombre del clúster. Puede elegir o insertar valores, o bien utilizar los valores predeterminados que haya seleccionado el administrador.

  4. Seleccione una subred en la que EMR Studio pueda lanzar el nuevo clúster. El administrador de Studio aprueba previamente cada opción de subred. Su espacio de trabajo debería poder conectarse a un clúster de cualquier subred.

  5. Seleccione Usar plantilla de clúster para aprovisionar el clúster y asociarlo al espacio de trabajo. EMR Studio tardará unos minutos en crear el clúster. Si usa el cuadro de diálogo Crear un espacio de trabajo, seleccione Crear un espacio de trabajo para crear el espacio de trabajo y aprovisionar el clúster. Una vez que EMR Studio aprovisione el nuevo clúster, lo asocia al espacio de trabajo.

Separar la computación de un espacio de trabajo de EMR Studio

Para intercambiar el clúster asociado a un espacio de trabajo, puede separar un clúster de la interfaz de usuario del espacio de trabajo.

Para separar un clúster de un espacio de trabajo
  1. En el espacio de trabajo que desee separar de un clúster, elija el icono Clústeres de EMR en la barra lateral izquierda para abrir el panel Clúster.

  2. En Seleccionar clúster, seleccione Separar y espere a que EMR Studio separe el clúster. Cuando se separe el clúster, verá un mensaje indicándole que la operación se ha realizado correctamente.

Para separar una aplicación de EMR sin servidor de un espacio de trabajo de EMR Studio

Para intercambiar la computación asociada a un espacio de trabajo, puede separar la aplicación de la interfaz de usuario del espacio de trabajo.

  1. En el espacio de trabajo que desee separar de un clúster, elija el icono Computación de Amazon EMR en la barra lateral izquierda para abrir el panel Computación.

  2. En Seleccionar computación, seleccione Separar y espere a que EMR Studio separe la aplicación. Cuando se separe la aplicación, verá un mensaje indicándole que la operación se ha realizado correctamente.