Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Asociar computación a un espacio de trabajo de EMR Studio
Amazon EMR Studio ejecuta comandos de cuadernos mediante un kernel en un clúster de EMR. Antes de poder seleccionar un núcleo, debe adjuntar el Workspace a un clúster que utilice EC2 instancias de Amazon, a un clúster de Amazon EMR en EKS o a una aplicación EMR Serverless. EMR Studio le permite asociar espacios de trabajo a clústeres nuevos o existentes y le brinda la flexibilidad de cambiar los clústeres sin cerrar el espacio de trabajo.
En esta sección se cubren los temas siguientes, que le ayudarán a trabajar con clústeres de EMR Studio y aprovisionarlos:
Adjuntar un EC2 clúster de Amazon a un espacio de trabajo de EMR Studio
Puedes adjuntar un clúster de EMR que se ejecute en Amazon EC2 a un espacio de trabajo al crear el espacio de trabajo o adjuntar un clúster a un espacio de trabajo existente. Si desea crear y asociar un clúster nuevo, consulte Crear y asociar un nuevo clúster de EMR a un espacio de trabajo de EMR Studio.
nota
Un espacio de trabajo de Studio con la propagación de identidades de confianza de IAM Identity Center habilitada solo puede conectarse a un clúster de EMR con una configuración de seguridad que tenga Identity Center habilitado.
Asociar un clúster de Amazon EMR en EKS a un espacio de trabajo de EMR Studio
Además de utilizar clústeres de Amazon EMR que se ejecutan en Amazon EC2, puede adjuntar un Workspace a un clúster de Amazon EMR en EKS para ejecutar código de notebook. Para obtener más información sobre Amazon EMR en EKS, consulte Qué es Amazon EMR en EKS.
Para poder conectar un espacio de trabajo a un clúster de Amazon EMR en EKS, el administrador de Studio debe concederle permisos de acceso.
nota
No puede lanzar un clúster de Amazon EMR en EKS en un EMR Studio con la propagación de identidades de confianza de IAM Identity Center.
Asociar una aplicación de Amazon EMR sin servidor a un espacio de trabajo de EMR Studio
Puede asociar un espacio de trabajo a una aplicación de EMR sin servidor para ejecutar cargas de trabajo interactivas. Para obtener más información, consulte Uso de cuadernos para ejecutar cargas de trabajo interactivas con EMR sin servidor a través de EMR Studio.
nota
No puede conectar una aplicación de EMR sin servidor a un EMR Studio con la propagación de identidades de confianza de IAM Identity Center.
ejemplo Adjunte un espacio de trabajo a una aplicación EMR sin servidor en JupyterLab
Para que pueda conectar un espacio de trabajo a una aplicación de EMR sin servidor, el administrador de su cuenta debe concederle los permisos de acceso, tal y como se describe en Required permissions for interactive workloads.
-
Diríjase a EMR Studio, seleccione su espacio de trabajo y, a continuación, seleccione Iniciar espacio de trabajo > Inicio rápido.
-
En el interior JupyterLab, abre la pestaña Clúster en la barra lateral izquierda.
-
Seleccione EMR sin servidor como opción de computación y, a continuación, seleccione una aplicación de EMR sin servidor y un rol de tiempo de ejecución.
-
Seleccione Asociar para asociar el clúster al espacio de trabajo.
Ahora, cuando abra este espacio de trabajo, debería ver la aplicación seleccionada que asoció.
Crear y asociar un nuevo clúster de EMR a un espacio de trabajo de EMR Studio
Los usuarios avanzados de EMR Studio pueden aprovisionar nuevos clústeres de EMR que se ejecuten en Amazon EC2 para usarlos con un espacio de trabajo. El nuevo clúster tiene todas las aplicaciones de macrodatos necesarias para EMR Studio instaladas de forma predeterminada.
Para crear clústeres, el administrador de Studio primero debe concederle el permiso mediante una política de sesión. Para obtener más información, consulte Creación de políticas de permisos para los usuarios de EMR Studio.
Puede crear un clúster nuevo en el cuadro de diálogo Crear un espacio de trabajo o desde el panel Clúster de la interfaz de usuario del espacio de trabajo. En cualquier caso, tiene dos opciones para crear un clúster:
-
Crear un clúster de EMR: cree un clúster de EMR eligiendo el tipo y el recuento de EC2 instancias de Amazon.
-
Utilizar una plantilla de clúster: aprovisione un clúster seleccionando una plantilla de clúster predefinida. Esta opción aparece si tiene permiso para usar plantillas de clúster.
nota
Si la propagación de identidades de confianza de IAM Identity Center está habilitada en el Studio, debe utilizar una plantilla para crear un clúster.
Para crear un clúster de EMR proporcionando una configuración de clúster
-
Elija un punto de inicio.
Para… Haga lo siguiente... Cree el clúster al crear un espacio de trabajo con el cuadro de diálogo Crear un espacio de trabajo. Amplíe la sección Configuración avanzada en el cuadro de diálogo Crear un espacio de trabajo y seleccione Crear un clúster de EMR. Cree el clúster desde el panel de clústeres de EMR en la interfaz de usuario del espacio de trabajo después de haber creado un espacio de trabajo. Elija la pestaña Clústeres de EMR en la barra lateral izquierda de un espacio de trabajo abierto, expanda la sección Configuración avanzada y elija Crear clúster. -
Ingrese un nombre de clúster. Asignar un nombre al clúster le ayudará a encontrarlo más adelante en la lista de clústeres de EMR Studio.
-
En Versión de Amazon EMR, seleccione una versión de Amazon EMR para el clúster.
-
Por ejemplo, selecciona el tipo y el número de EC2 instancias de Amazon para el clúster. Para obtener más información sobre la selección de los tipos de instancia, consulte Configurar los tipos de EC2 instancias de Amazon para utilizarlos con Amazon EMR. Se utilizará una instancia como nodo principal.
-
Seleccione una subred en la que EMR Studio pueda lanzar el nuevo clúster. El administrador de Studio aprueba previamente cada opción de subred. Su espacio de trabajo debería poder conectarse a un clúster de cualquier subred de la lista.
-
Seleccione un URI de S3 para el almacenamiento de registros.
-
Seleccione Crear clúster de EMR para aprovisionarlo. Si usa el cuadro de diálogo Crear un espacio de trabajo, seleccione Crear un espacio de trabajo para crear el espacio de trabajo y aprovisionar el clúster. Una vez que EMR Studio aprovisione el nuevo clúster, lo asocia al espacio de trabajo.
Para crear un clúster mediante una plantilla de clúster
-
Elija un punto de inicio.
Para… Haga lo siguiente... Cree el clúster al crear un espacio de trabajo con el cuadro de diálogo Crear un espacio de trabajo. Expanda la sección Configuración avanzada en el cuadro de diálogo Crear un espacio de trabajo y seleccione Usar una plantilla de clúster. Cree el clúster desde el panel de clústeres de EMR en la interfaz de usuario del espacio de trabajo. Seleccione la pestaña Clústeres de EMR en la barra lateral izquierda de un espacio de trabajo abierto, expanda la sección Configuración avanzada y seleccione Plantilla de clúster. -
En la lista desplegable, seleccione una plantilla de clúster. Cada plantilla de clúster disponible incluye una breve descripción para ayudarle a realizar una selección.
-
La plantilla de clúster que elija puede tener parámetros adicionales, como la versión de lanzamiento de Amazon EMR o el nombre del clúster. Puede elegir o insertar valores, o bien utilizar los valores predeterminados que haya seleccionado el administrador.
-
Seleccione una subred en la que EMR Studio pueda lanzar el nuevo clúster. El administrador de Studio aprueba previamente cada opción de subred. Su espacio de trabajo debería poder conectarse a un clúster de cualquier subred.
-
Seleccione Usar plantilla de clúster para aprovisionar el clúster y asociarlo al espacio de trabajo. EMR Studio tardará unos minutos en crear el clúster. Si usa el cuadro de diálogo Crear un espacio de trabajo, seleccione Crear un espacio de trabajo para crear el espacio de trabajo y aprovisionar el clúster. Una vez que EMR Studio aprovisione el nuevo clúster, lo asocia al espacio de trabajo.
Separar la computación de un espacio de trabajo de EMR Studio
Para intercambiar el clúster asociado a un espacio de trabajo, puede separar un clúster de la interfaz de usuario del espacio de trabajo.
Para separar un clúster de un espacio de trabajo
-
En el espacio de trabajo que desee separar de un clúster, elija el icono Clústeres de EMR en la barra lateral izquierda para abrir el panel Clúster.
-
En Seleccionar clúster, seleccione Separar y espere a que EMR Studio separe el clúster. Cuando se separe el clúster, verá un mensaje indicándole que la operación se ha realizado correctamente.
Para separar una aplicación de EMR sin servidor de un espacio de trabajo de EMR Studio
Para intercambiar la computación asociada a un espacio de trabajo, puede separar la aplicación de la interfaz de usuario del espacio de trabajo.
-
En el espacio de trabajo que desee separar de un clúster, elija el icono Computación de Amazon EMR en la barra lateral izquierda para abrir el panel Computación.
-
En Seleccionar computación, seleccione Separar y espere a que EMR Studio separe la aplicación. Cuando se separe la aplicación, verá un mensaje indicándole que la operación se ha realizado correctamente.