Crea un estudio EMR - Amazon EMR

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Crea un estudio EMR

Puedes crear un EMR estudio para tu equipo con la EMR consola de Amazon o la AWS CLI. La creación de una instancia de Studio forma parte de la configuración de Amazon EMR Studio.

Requisitos previos 

Antes de crear un estudio, asegúrese de haber completado las tareas anteriores de Configura un Amazon EMR Studio.

Para crear un estudio con AWS CLI, debes tener instalada la última versión. Para obtener más información, consulte Instalación o actualización de la versión de AWS CLI más reciente.

importante

Desactive las herramientas de administración de proxy, como FoxyProxy o SwitchyOmega en el navegador, antes de crear un Studio. Los proxies activos pueden provocar un mensaje de error de red al seleccionar Crear estudio.

Amazon te EMR ofrece una experiencia de consola sencilla para crear un Studio, de forma que puedas empezar rápidamente con la configuración predeterminada para ejecutar cargas de trabajo interactivas o trabajos por lotes con la configuración predeterminada. Al crear un EMR estudio, también se crea una aplicación EMR sin servidor lista para sus trabajos interactivos.

Si quieres tener el control total de los ajustes de tu estudio, puedes elegir Personalizado, que te permite configurar todos los ajustes adicionales.

Interactive workloads
Para crear un EMR estudio para cargas de trabajo interactivas
  1. Abre la EMR consola de Amazon en https://console.aws.amazon.com/emr.

  2. En EMRStudio, en el panel de navegación de la izquierda, selecciona Comenzar. También puede crear un estudio nuevo desde la página Studios.

  3. Amazon te EMR proporciona la configuración predeterminada si estás creando un EMR Studio para cargas de trabajo interactivas, pero puedes editar esta configuración. Los ajustes configurables incluyen el nombre del EMR estudio, la ubicación en S3 de tu espacio de trabajo, el rol de servicio que vas a usar, los espacios de trabajo que deseas usar, el nombre de la aplicación EMR sin servidor y el rol de tiempo de ejecución asociado.

  4. Selecciona Crear estudio e inicia Workspace para terminar y navegar a la página de Studios. El nuevo estudio aparece en la lista con detalles como el nombre del estudio, la fecha de creación y el acceso al estudio URL. El espacio de trabajo se abre en una nueva pestaña del navegador.

Batch jobs
Para crear un EMR estudio para cargas de trabajo interactivas
  1. Abre la EMR consola de Amazon en https://console.aws.amazon.com/emr.

  2. En EMRStudio, en el panel de navegación de la izquierda, selecciona Comenzar. También puede crear un estudio nuevo desde la página Studios.

  3. Amazon te EMR proporciona la configuración predeterminada si estás creando un EMR Studio para trabajos por lotes, pero puedes editarla. Los ajustes configurables incluyen el nombre del EMR estudio, el nombre de la aplicación EMR Serverless y la función de tiempo de ejecución asociada.

  4. Selecciona Crear estudio e inicia Workspace para terminar y navegar a la página de Studios. El nuevo estudio aparece en la lista con detalles como el nombre del estudio, la fecha de creación y el acceso al estudio URL. EMREl estudio se abre en una pestaña nueva del navegador.

Custom settings
Para crear un EMR estudio con ajustes personalizados
  1. Abre la EMR consola de Amazon en https://console.aws.amazon.com/emr.

  2. En EMRStudio, en el panel de navegación de la izquierda, selecciona Comenzar. También puede crear un estudio nuevo desde la página Studios.

  3. Seleccione Crear un estudio para abrir la página Crear un estudio.

  4. Introduce un nombre de estudio.

  5. Elija crear un nuevo depósito de S3 o utilizar una ubicación existente.

  6. Elija el espacio de trabajo que desee añadir al estudio. Puedes añadir hasta 3 espacios de trabajo.

  7. En Autenticación, seleccione un modo de autenticación para el estudio y proporcione la información según la siguiente tabla. Para obtener más información sobre la autenticación de EMR Studio, consulteElige un modo de autenticación para Amazon EMR Studio.

    Si usa… Haga lo siguiente...
    IAMautenticación o federación

    El método de autenticación predeterminado es AWS Identity and Access Management (IAM). En la parte inferior de la pantalla, también puede agregar etiquetas para que los usuarios específicos puedan acceder al Studio, como se describe en Asigne un usuario o un grupo a un EMR estudio.

    Si desea que los usuarios federados inicien sesión con Studio URL y las credenciales de su proveedor de identidad (IdP), seleccione su IdP en la lista desplegable e introduzca el nombre de usuario y el nombre de parámetro de su proveedor de identidad (IdP). URL RelayState

    Para obtener una lista de RelayState nombres URLs y autenticaciones de IdP, consulte. RelayState Parámetros y autenticación del proveedor de identidad URLs

    IAMAutenticación de Identity

    Seleccione su rol de servicio de EMR Studio y su rol de usuario. Para obtener más información, consulte Cree un rol de servicio de EMR Studio y Cree un rol de usuario de EMR Studio para el modo de autenticación de IAM Identity Center.

    Si utilizas la autenticación con IAMIdentity Center (anteriormente AWS Single Sign On) para Studio, puedes optar por agilizar la experiencia de inicio de sesión de los usuarios con la opción Habilitar la propagación de identidades de forma fiable. Gracias a la propagación de identidades fiable, los usuarios pueden iniciar sesión con sus credenciales de Identity Center y hacer que sus identidades se propaguen a los AWS servicios descendentes cuando utilizan Studio.

    En la sección Acceso a las aplicaciones, también puede especificar si todos los usuarios y grupos de Identity Center pueden tener acceso al Studio o si solo los usuarios y grupos asignados que elija pueden acceder al Studio.

    Para obtener más informaciónIntegre Amazon EMR con AWS IAM Identity Center, consulte la Guía del usuario de Identity Center y también sobre la propagación fiable de AWS IAM identidades entre aplicaciones.

  8. ParaVPC, elija Amazon Virtual Private Cloud (VPC) para el estudio en la lista desplegable.

  9. En Subredes, selecciona un máximo de cinco subredes VPC para asociarlas al estudio. Tiene la opción de agregar más subredes después de crear el estudio.

  10. En Grupos de seguridad, seleccione los grupos de seguridad predeterminados o grupos de seguridad personalizados. Para obtener más información, consulte Defina grupos de seguridad para controlar el tráfico de red de EMR Studio.

    Si selecciona... Haga lo siguiente...
    Los grupos de seguridad predeterminados de EMR Studio

    Para habilitar la vinculación de repositorios basada en Git para el estudio, seleccione Habilitar clústeres o puntos de enlace y repositorio Git. De lo contrario, seleccione Habilitar clústeres/puntos de conexión.

    Grupos de seguridad personalizados para su estudio
    • En Grupo de seguridad de los clústeres/puntos de conexión, seleccione el grupo de seguridad del motor que configuró en la lista desplegable. Su estudio usa este grupo de seguridad para permitir el acceso entrante desde los espacios de trabajo asociados.

    • En Grupo de seguridad del espacio de trabajo, seleccione el grupo de seguridad del espacio de trabajo que configuró en la lista desplegable. Tu estudio usa este grupo de seguridad con Workspaces para proporcionar acceso saliente a los EMR clústeres de Amazon adjuntos y a los repositorios de Git alojados públicamente.

  11. Añade etiquetas a tu Studio y a otros recursos. Para obtener más información sobre las etiquetas, consulta Clústeres de etiquetas.

  12. Selecciona Crear estudio e inicia Workspace para terminar y navegar a la página de estudios. El nuevo estudio aparece en la lista con detalles como el nombre del estudio, la fecha de creación y el acceso al estudio URL.

Después de crear el estudio, siga las instrucciones que aparecen en Asigne un usuario o un grupo a un EMR estudio.

CLI
nota

Se incluyen caracteres de continuación de línea de Linux (\) para facilitar la lectura. Se pueden eliminar o utilizar en los comandos de Linux. En Windows, elimínelos o sustitúyalos por un signo de intercalación (^).

ejemplo — Crea un EMR estudio que lo utilice IAM para la autenticación

El siguiente AWS CLI comando de ejemplo crea un EMR estudio con modo IAM de autenticación. Cuando utilizas la IAM autenticación o la federación para Studio, no especificas un--user-role.

Para permitir que los usuarios federados inicien sesión con Studio URL y las credenciales de su proveedor de identidad (IdP), especifique --idp-auth-url su y. --idp-relay-state-parameter-name Para obtener una lista de RelayState nombres URLs y autenticaciones de IdP, consulte. RelayState Parámetros y autenticación del proveedor de identidad URLs

aws emr create-studio \ --name <example-studio-name> \ --auth-mode IAM \ --vpc-id <example-vpc-id> \ --subnet-ids <subnet-id-1> <subnet-id-2>... <subnet-id-5> \ --service-role <example-studio-service-role-name> \ --user-role studio-user-role-name \ --workspace-security-group-id <example-workspace-sg-id> \ --engine-security-group-id <example-engine-sg-id> \ --default-s3-location <example-s3-location> \ --idp-auth-url <https://EXAMPLE/login/> \ --idp-relay-state-parameter-name <example-RelayState>
ejemplo — Cree un EMR estudio que utilice Identity Center para la autenticación

El siguiente comando de AWS CLI ejemplo crea un EMR Studio que usa el modo de autenticación de IAM Identity Center. Al utilizar la autenticación de IAM Identity Center, debe especificar un--user-role.

Para obtener más información sobre el modo de autenticación de IAM Identity Center, consulteConfigurar el modo de autenticación de IAM Identity Center para Amazon EMR Studio.

aws emr create-studio \ --name <example-studio-name> \ --auth-mode SSO \ --vpc-id <example-vpc-id> \ --subnet-ids <subnet-id-1> <subnet-id-2>... <subnet-id-5> \ --service-role <example-studio-service-role-name> \ --user-role <example-studio-user-role-name> \ --workspace-security-group-id <example-workspace-sg-id> \ --engine-security-group-id <example-engine-sg-id> \ --default-s3-location <example-s3-location> --trusted-identity-propagation-enabled \ --idc-user-assignment OPTIONAL \ --idc-instance-arn <iam-identity-center-instance-arn>
ejemplo — CLI salida para aws emr create-studio

A continuación, se muestra un ejemplo de la salida que aparece después de crear un estudio.

{ StudioId: "es-123XXXXXXXXX", Url: "https://es-123XXXXXXXXX.emrstudio-prod.us-east-1.amazonaws.com" }

Para obtener más información sobre el comando create-studio, consulte Referencia del comando AWS CLI .

RelayState Parámetros y autenticación del proveedor de identidad URLs

Si utilizas la IAM federación y quieres que los usuarios inicien sesión con tu Studio URL y las credenciales de tu proveedor de identidad (IdP), puedes especificar el nombre de usuario URL y el nombre del RelayStateparámetro de tu proveedor de identidad (IdP) cuando lo hagas. Crea un estudio EMR

En la siguiente tabla se muestran la autenticación estándar URL y el nombre de los RelayState parámetros de algunos proveedores de identidad populares.

Proveedor de identidades Parámetro La autenticación URL
Auth0 RelayState https://<sub_domain>.auth0.com/samlp/<app_id>
Cuentas de Google RelayState https://accounts.google.com/o/saml2/initsso?idpid=<idp_id>&spid=<sp_id>&forceauthn=false
Microsoft Azure RelayState https://myapps.microsoft.com/signin/<app_name>/<app_id>?tenantId=<tenant_id>
Okta RelayState https://<sub_domain>.okta.com/app/<app_name>/<app_id>/sso/saml
PingFederate TargetResource https://<host>/idp/<idp_id>/startSSO.ping?PartnerSpId=<sp_id>
PingOne TargetResource https://sso.connect.pingidentity.com/sso/sp/initsso?saasid=<app_id>&idpid=<idp_id>