Crie um EMR estúdio - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Crie um EMR estúdio

Você pode criar um EMR estúdio para sua equipe com o EMR console da Amazon ou AWS CLI o. A criação de uma instância do Studio faz parte da configuração do Amazon EMR Studio.

Pré-requisitos

Antes de criar um Studio, certifique-se de ter concluído as tarefas anteriores em Configurar um Amazon EMR Studio.

Para criar um Studio usando o AWS CLI, você deve ter a versão mais recente instalada. Para obter mais informações, consulte Instalar ou atualizar a versão mais recente da AWS CLI.

Importante

Desative as ferramentas de gerenciamento de proxy, como FoxyProxy ou SwitchyOmega no navegador, antes de criar um Studio. Os proxies ativos podem resultar em uma mensagem de erro de falha de rede quando você escolhe Criar Studio.

EMRA Amazon oferece uma experiência de console simples para criar um Studio, para que você possa começar rapidamente com as configurações padrão para executar cargas de trabalho interativas ou trabalhos em lote com as configurações padrão. A criação de um EMR estúdio também cria um aplicativo EMR sem servidor pronto para seus trabalhos interativos.

Se quiser ter controle total sobre as configurações do seu Studio, você pode escolher Personalizado, que permite definir todas as configurações adicionais.

Interactive workloads
Para criar um EMR estúdio para cargas de trabalho interativas
  1. Abra o EMR console da Amazon em https://console.aws.amazon.com/emr.

  2. Em EMRStudio, no painel de navegação à esquerda, escolha Introdução. Você também pode criar um novo Studio na página Studios.

  3. EMRA Amazon fornece configurações padrão para você se você estiver criando um EMR Studio para cargas de trabalho interativas, mas você pode editar essas configurações. As configurações configuráveis incluem o nome do EMR Studio, a localização do S3 para seu espaço de trabalho, a função de serviço a ser usada, o (s) espaço (s) de trabalho que você deseja usar, o nome do aplicativo EMR sem servidor e a função de tempo de execução associada.

  4. Escolha Create Studio e inicie o Workspace para finalizar e navegar até a página Studios. Seu novo estúdio aparece na lista com detalhes como nome do estúdio, data de criação e acesso ao estúdio URL. Seu espaço de trabalho é aberto em uma nova guia no seu navegador.

Batch jobs
Para criar um EMR estúdio para cargas de trabalho interativas
  1. Abra o EMR console da Amazon em https://console.aws.amazon.com/emr.

  2. Em EMRStudio, no painel de navegação à esquerda, escolha Introdução. Você também pode criar um novo Studio na página Studios.

  3. EMRA Amazon fornece configurações padrão para você se você estiver criando um EMR Studio para trabalhos em lote, mas você pode editar essas configurações. As configurações configuráveis incluem o nome do EMR Studio, o nome do aplicativo EMR sem servidor e a função de tempo de execução associada.

  4. Escolha Create Studio e inicie o Workspace para finalizar e navegar até a página Studios. Seu novo estúdio aparece na lista com detalhes como nome do estúdio, data de criação e acesso ao estúdio URL. Seu EMR estúdio é aberto em uma nova guia no seu navegador.

Custom settings
Para criar um EMR estúdio com configurações personalizadas
  1. Abra o EMR console da Amazon em https://console.aws.amazon.com/emr.

  2. Em EMRStudio, no painel de navegação à esquerda, escolha Introdução. Você também pode criar um novo Studio na página Studios.

  3. Escolha Criar um Studio para abrir a página Criar um Studio.

  4. Insira o nome do estúdio.

  5. Escolha criar um novo bucket do S3 ou usar um local existente.

  6. Escolha o espaço de trabalho a ser adicionado ao Studio. Você pode adicionar até 3 espaços de trabalho.

  7. Em Autenticação, escolha um modo de autenticação para o Studio e forneça informações de acordo com a tabela a seguir. Para saber mais sobre a autenticação do EMR Studio, consulteEscolha um modo de autenticação para o Amazon EMR Studio.

    Se você usar... Fazer isso...
    IAMautenticação ou federação

    O método de autenticação padrão é AWS Identity and Access Management (IAM). Na parte inferior da tela, você também pode adicionar tags para dar acesso ao Studio para usuários específicos, conforme descrito em Atribuir um usuário ou grupo a um EMR estúdio.

    Se você quiser que os usuários federados façam login usando o Studio URL e as credenciais do seu provedor de identidade (IdP), selecione seu IdP na lista suspensa e insira seu nome de login e parâmetro do provedor de identidade (IdP). URL RelayState

    Para obter uma lista de RelayState nomes URLs e autenticação de IdP, consulte. RelayState Parâmetros e autenticação do provedor de identidade URLs

    IAMautenticação do Identity Center

    Selecione sua função de serviço do EMR Studio e sua função de usuário. Para ter mais informações, consulte Criar uma função de serviço do EMR Studio e Crie uma função de usuário do EMR Studio para o modo de autenticação do IAM Identity Center.

    Ao usar a autenticação do IAM Identity Center (antigo AWS Single Sign On) para o Studio, você pode optar por simplificar a experiência de login dos usuários com a opção Habilitar propagação de identidade confiável. Com a propagação de identidade confiável, os usuários podem fazer login com suas credenciais do Identity Center e ter suas identidades propagadas para AWS serviços posteriores ao usarem o Studio.

    Na seção Acesso à aplicação, você também pode especificar se todos os usuários e grupos no seu Centro de Identidade devem ter acesso ao Studio ou se somente os usuários e grupos atribuídos que você escolher podem acessá-lo.

    Para obter mais informaçõesIntegre a Amazon EMR com AWS IAM Identity Center, consulte e também Propagação confiável de identidade entre aplicativos no Guia do Usuário do AWS IAM Identity Center.

  8. ParaVPC, escolha uma Amazon Virtual Private Cloud (VPC) para o Studio na lista suspensa.

  9. Em Sub-redes, selecione no máximo cinco sub-redes VPC para associar ao Studio. Você tem a opção de adicionar mais sub-redes após a criação do Studio.

  10. Em Grupos de segurança, escolha os grupos de segurança padrão ou os grupos de segurança personalizados. Para obter mais informações, consulte Defina grupos de segurança para controlar o tráfego de rede do EMR Studio.

    Se você escolher... Fazer isso...
    Os grupos de segurança padrão do EMR Studio

    Para habilitar a vinculação de repositórios baseados em Git para o Studio, escolha Habilitar clusters, endpoints e o repositório Git. Caso contrário, escolha Habilitar clusters e endpoints.

    Os grupos de segurança personalizados para seu Studio
    • Em Grupo de segurança de cluster e endpoint, selecione o grupo de segurança do mecanismo que você configurou usando a lista suspensa. Seu Studio usa esse grupo de segurança para permitir o acesso de entrada de Workspaces anexados.

    • Em Grupo de segurança do Workspace, selecione o grupo de segurança do Workspace que você configurou usando a lista suspensa. Seu estúdio usa esse grupo de segurança com o Workspaces para fornecer acesso externo a EMR clusters Amazon conectados e repositórios Git hospedados publicamente.

  11. Adicione tags ao seu Studio e a outros recursos. Para obter mais informações sobre tags, consulte Clusters de tags.

  12. Escolha Create Studio e inicie o Workspace para finalizar e navegar até a página Studios. Seu novo estúdio aparece na lista com detalhes como nome do estúdio, data de criação e acesso ao estúdio URL.

Depois de criar um Studio, siga as instruções em Atribuir um usuário ou grupo a um EMR estúdio.

CLI
nota

Os caracteres de continuação de linha do Linux (\) são incluídos para facilitar a leitura. Eles podem ser removidos ou usados ​​em comandos do Linux. No Windows, remova-os ou substitua-os por um sinal de interpolação (^).

exemplo — Crie um EMR estúdio que use IAM para autenticação

O AWS CLI comando de exemplo a seguir cria um EMR Studio com modo de IAM autenticação. Ao usar IAM autenticação ou federação para o Studio, você não especifica um--user-role.

Para permitir que usuários federados façam login usando o Studio URL e as credenciais do seu provedor de identidade (IdP), especifique seu e. --idp-auth-url --idp-relay-state-parameter-name Para obter uma lista de RelayState nomes URLs e autenticação de IdP, consulte. RelayState Parâmetros e autenticação do provedor de identidade URLs

aws emr create-studio \ --name <example-studio-name> \ --auth-mode IAM \ --vpc-id <example-vpc-id> \ --subnet-ids <subnet-id-1> <subnet-id-2>... <subnet-id-5> \ --service-role <example-studio-service-role-name> \ --user-role studio-user-role-name \ --workspace-security-group-id <example-workspace-sg-id> \ --engine-security-group-id <example-engine-sg-id> \ --default-s3-location <example-s3-location> \ --idp-auth-url <https://EXAMPLE/login/> \ --idp-relay-state-parameter-name <example-RelayState>
exemplo — Crie um EMR estúdio que use o Identity Center para autenticação

O comando de AWS CLI exemplo a seguir cria um EMR Studio que usa o modo de autenticação do IAM Identity Center. Ao usar a autenticação do IAM Identity Center, você deve especificar um--user-role.

Para obter mais informações sobre o modo de autenticação do IAM Identity Center, consulteConfigurar o modo de autenticação do IAM Identity Center para o Amazon EMR Studio.

aws emr create-studio \ --name <example-studio-name> \ --auth-mode SSO \ --vpc-id <example-vpc-id> \ --subnet-ids <subnet-id-1> <subnet-id-2>... <subnet-id-5> \ --service-role <example-studio-service-role-name> \ --user-role <example-studio-user-role-name> \ --workspace-security-group-id <example-workspace-sg-id> \ --engine-security-group-id <example-engine-sg-id> \ --default-s3-location <example-s3-location> --trusted-identity-propagation-enabled \ --idc-user-assignment OPTIONAL \ --idc-instance-arn <iam-identity-center-instance-arn>
exemplo — CLI saída para aws emr create-studio

A seguir, é apresentado um exemplo da saída que aparece após a criação de um Studio.

{ StudioId: "es-123XXXXXXXXX", Url: "https://es-123XXXXXXXXX.emrstudio-prod.us-east-1.amazonaws.com" }

Para obter mais informações sobre o comando create-studio, consulte AWS CLI Command Reference.

RelayState Parâmetros e autenticação do provedor de identidade URLs

Quando você usa a IAM federação e deseja que os usuários façam login usando seu Studio URL e as credenciais do seu provedor de identidade (IdP), você pode especificar o URL login do provedor de identidade (IdP) RelayStatee o nome do parâmetro quando quiser. Crie um EMR estúdio

A tabela a seguir mostra a autenticação padrão URL e o nome do RelayState parâmetro para alguns provedores de identidade populares.

Provedor de identidades Parâmetro Autentificação URL
Auth0 RelayState https://<sub_domain>.auth0.com/samlp/<app_id>
Contas do Google RelayState https://accounts.google.com/o/saml2/initsso?idpid=<idp_id>&spid=<sp_id>&forceauthn=false
Microsoft Azure RelayState https://myapps.microsoft.com/signin/<app_name>/<app_id>?tenantId=<tenant_id>
Okta RelayState https://<sub_domain>.okta.com/app/<app_name>/<app_id>/sso/saml
PingFederate TargetResource https://<host>/idp/<idp_id>/startSSO.ping?PartnerSpId=<sp_id>
PingOne TargetResource https://sso.connect.pingidentity.com/sso/sp/initsso?saasid=<app_id>&idpid=<idp_id>