Anexar uma computação a um Workspace do EMR Studio - Amazon EMR

Anexar uma computação a um Workspace do EMR Studio

O Amazon EMR Studio executa comandos de cadernos usando um kernel em um cluster do EMR. Antes de selecionar um kernel, você deve anexar o Workspace a um cluster que usa as instâncias do Amazon EC2 a um cluster do Amazon EMR no EKS ou a uma aplicação do EMR Serverless. O EMR Studio permite anexar Workspaces a clusters novos ou existentes, e oferece flexibilidade para alterar clusters sem a necessidade de fechar o Workspace.

Esta seção aborda os seguintes tópicos para ajudar você a trabalhar e provisionar clusters para o EMR Studio:

Anexar um cluster do Amazon EC2 a um Workspace do EMR Studio

Você pode anexar um cluster do EMR em execução no Amazon EC2 a um Workspace ao criar o Workspace ou anexar um cluster a um Workspace existente. Se você desejar criar e anexar um novo cluster, consulte Criar e anexar um novo cluster do EMR a um Workspace do EMR Studio.

nota

Um espaço de trabalho em um Studio que tenha a propagação de identidade confiável do Centro de Identidade do IAM habilitada só pode ser anexado a um cluster do EMR com uma configuração de segurança que tenha o Centro de Identidade habilitado.

On create
Anexação a um cluster de computação do Amazon EMR ao criar um Workspace
  1. Na caixa de diálogo Criar um Workspace, certifique-se de já ter selecionado uma sub-rede para o novo Workspace. Expanda a seção Configuração avançada.

  2. Escolha Anexar Workspace a um cluster do EMR.

  3. Na lista suspensa Cluster do EMR, selecione um cluster do EMR existente para anexar ao Workspace.

Depois de anexar um cluster, conclua a criação do Workspace. Ao abrir o novo Workspace pela primeira vez e escolher o painel Clusters do EMR, você deverá visualizar o cluster selecionado anexado.

On launch
Anexação a um cluster de computação do Amazon EMR ao iniciar o Workspace
  1. Navegue até a lista Workspaces e selecione a linha do Workspace que você deseja iniciar. Em seguida, selecione Iniciar o Workspace > Iniciar com opções.

  2. Escolha um cluster do EMR para anexar ao seu Workspace.

Depois de anexar um cluster, conclua a criação do Workspace. Ao abrir o novo Workspace pela primeira vez e escolher o painel Clusters do EMR, você deverá visualizar o cluster selecionado anexado.

In JupyterLab
Anexação de um Workspace a um cluster de computação do Amazon EMR no JupyterLab
  1. Selecione seu Workspace e, em seguida, escolha Iniciar o Workspace > Início rápido.

  2. No JupyterLab, abra a guia Cluster na barra lateral à esquerda.

  3. Selecione o menu suspenso Cluster do EMR no EC2 ou selecione um cluster do Amazon EMR no EKS.

  4. Selecione Anexar para anexar o cluster ao seu Workspace.

Depois de anexar o cluster, conclua a criação do Workspace. Ao abrir o novo Workspace pela primeira vez e escolher o painel Clusters do EMR, você deverá visualizar o cluster selecionado anexado.

In the Workspace UI
Anexação de um Workspace a um cluster de computação do Amazon EMR usando a interface do usuário do Workspace
  1. No Workspace que você deseja anexar a um cluster, escolha o ícone Clusters do EMR na barra lateral à esquerda para abrir o painel Cluster.

  2. Em Tipo de cluster, expanda o menu suspenso e selecione Cluster do EMR no EC2.

  3. Escolha um cluster na lista suspensa. Pode ser necessário desanexar um cluster existente primeiro para habilitar a lista suspensa de seleção de cluster.

  4. Escolha Anexar. Quando o cluster for anexado, você visualizará uma mensagem de êxito.

Anexar um cluster do Amazon EMR no EKS a um Workspace do EMR Studio

Além de usar clusters do Amazon EMR em execução no Amazon EC2, é possível anexar um Workspace a um cluster do Amazon EMR no EKS para executar códigos de cadernos. Para obter mais informações sobre o Amazon EMR no EKS, consulte O que é o Amazon EMR no EKS?.

Antes de conectar um Workspace a um cluster do Amazon EMR no EKS, o administrador do Studio deve conceder a você as permissões de acesso.

nota

Não é possível executar um cluster do Amazon EMR no EKS em um EMR Studio que usa a propagação de identidade confiável do Centro de Identidade do IAM.

On create
Anexar um cluster do Amazon EMR no EKS ao criar um Workspace
  1. Na caixa de diálogo Criar um Workspace, expanda a seção Configuração avançada.

  2. Escolha Anexar Workspace a um cluster do Amazon EMR no EKS.

  3. Em Cluster do Amazon EMR no EKS, escolha um cluster na lista suspensa.

  4. Em Selecionar um endpoint, escolha um endpoint gerenciado para anexar ao Workspace. Um endpoint gerenciado corresponde a um gateway que permite que o EMR Studio se comunique com o cluster escolhido.

  5. Escolha Criar um Workspace para concluir o processo de criação do Workspace e anexar o cluster selecionado.

Depois de anexar um cluster, você poderá concluir o processo de criação do Workspace. Ao abrir o novo Workspace pela primeira vez e escolher o painel Clusters do EMR, você visualizará que o cluster selecionado está anexado.

In the Workspace UI
Anexar um cluster do Amazon EMR no EKS usando a interface do usuário do Workspace
  1. No Workspace que você deseja anexar a um cluster, escolha o ícone Clusters do EMR na barra lateral à esquerda para abrir o painel Cluster.

  2. Expanda o menu suspenso Tipo de cluster e escolha Clusters do EMR no EKS.

  3. Em Cluster do EMR no EKS, escolha um cluster na lista suspensa.

  4. Em Endpoint, escolha um endpoint gerenciado para anexar ao Workspace. Um endpoint gerenciado corresponde a um gateway que permite que o EMR Studio se comunique com o cluster escolhido.

  5. Escolha Anexar. Quando o cluster for anexado, você visualizará uma mensagem de êxito.

Anexar uma aplicação do Amazon EMR Serverless a um Workspace do EMR Studio

É possível conectar um Workspace a uma aplicação do EMR Serverless para executar workloads interativas. Para obter mais informações, consulte Usar cadernos para executar workloads interativas com o EMR Serverless por meio do EMR Studio.

nota

Não é possível anexar uma aplicação do EMR Sem Servidor ao EMR Studio que usa propagação de identidade confiável do Centro de Identidade do IAM.

exemplo Anexar um Workspace a uma aplicação do EMR Serverless no JupyterLab

Antes de conectar um Workspace a uma aplicação do EMR Serverless, o administrador da conta deve conceder permissões de acesso conforme descrito em Permissões obrigatórias para workloads interativas.

  1. Navegue para o EMR Studio, selecione seu Workspace e, em seguida, escolha Iniciar o Workspace > Início rápido.

  2. No JupyterLab, abra a guia Cluster na barra lateral à esquerda.

  3. Selecione EMR Serverless como opção de computação e, em seguida, selecione uma aplicação do EMR Serverless e uma função de runtime.

  4. Selecione Anexar para anexar o cluster ao seu Workspace.

Agora, ao abrir esse Workspace, você deverá ver a aplicação selecionada anexada.

Criar e anexar um novo cluster do EMR a um Workspace do EMR Studio

Os usuários avançados do EMR Studio podem provisionar novos clusters do EMR em execução no Amazon EC2 para uso com um Workspace. O novo cluster tem todas as aplicações de big data obrigatórias para o EMR Studio instaladas por padrão.

Para criar clusters, primeiro é necessário que o administrador do Studio conceda permissão a você usando uma política de sessão. Para ter mais informações, consulte Criação de políticas de permissões para usuários do EMR Studio.

Você pode criar um novo cluster na caixa de diálogo Criar um Workspace ou no painel Cluster na interface do usuário do Workspace. De qualquer forma, você tem duas opções de criação de cluster:

  1. Criar um cluster do EMR: crie um cluster do EMR ao escolher o tipo e a contagem da instância do Amazon EC2.

  2. Usar um modelo de cluster: provisione um cluster ao selecionar um modelo de cluster definido previamente. Esta opção aparece se você tiver permissão para usar os modelos de cluster.

    nota

    Se você habilitou a propagação de identidade confiável com o Centro de Identidade do IAM para o seu Studio, deverá usar um modelo para criar um cluster.

Criar um cluster do EMR ao fornecer uma configuração de cluster
  1. Escolha um ponto de partida.

    Para... Fazer isso...
    Criar o cluster ao criar um Workspace com a caixa de diálogo Criar um Workspace. Expanda a seção Configuração avançada na caixa de diálogo Criar um Workspace e selecione Criar um cluster do EMR.
    Criar o cluster usando o painel Cluster do EMR na interface do usuário do Workspace após criar um Workspace. Escolha a guia Clusters do EMR na barra lateral à esquerda de um Workspace, expanda a seção Configuração avançada e escolha Criar cluster.
  2. Insira um Nome de cluster. Nomear o cluster ajuda você a encontrá-lo posteriormente na lista Clusters do EMR Studio.

  3. Na Versão do Amazon EMR, escolha uma versão de liberação do Amazon EMR para o cluster.

  4. Em Instância, selecione o tipo e o número de instâncias do Amazon EC2 para o cluster. Para obter mais informações sobre como selecionar os tipos de instância, consulte Configurar tipos de instância do Amazon EC2 para uso com o Amazon EMR. Uma instância será usada como nó primário.

  5. Selecione uma Sub-rede na qual o EMR Studio possa iniciar o novo cluster. Cada opção de sub-rede é aprovada previamente pelo administrador do Studio, e seu Workspace deve ser capaz de se conectar a um cluster em qualquer sub-rede listada.

  6. Escolha um URI do S3 para o armazenamento de log.

  7. Escolha Criar cluster do EMR para provisionar o cluster. Se você usar a caixa de diálogo Criar um Workspace, escolha Criar um Workspace para criar o Workspace e provisionar o cluster. Depois que o EMR Studio provisiona o novo cluster, ele anexa o cluster ao Workspace.

Criar um cluster usando um modelo de cluster
  1. Escolha um ponto de partida.

    Para... Fazer isso...
    Criar o cluster ao criar um Workspace com a caixa de diálogo Criar um Workspace. Expanda a seção Configuração avançada na caixa de diálogo Criar um Workspace e selecione Usar um modelo de cluster.
    Criar o cluster usando o painel Cluster do EMR na interface do usuário do Workspace. Escolha a guia Clusters do EMR na barra lateral à esquerda de um Workspace, expanda a seção Configuração avançada e, em seguida, selecione Modelo de cluster.
  2. Selecione um modelo de cluster na lista suspensa. Cada modelo de cluster disponível inclui uma breve descrição para ajudar você a fazer uma seleção.

  3. O modelo de cluster escolhido pode ter parâmetros adicionais, como a versão de liberação do Amazon EMR ou o nome do cluster. Você pode escolher ou inserir valores, ou usar os valores padrão selecionados pelo administrador.

  4. Selecione uma Sub-rede na qual o EMR Studio possa iniciar o novo cluster. Cada opção de sub-rede é aprovada previamente pelo administrador do Studio, e seu Workspace deve ser capaz de se conectar a um cluster em qualquer sub-rede.

  5. Escolha Usar modelo de cluster para provisionar o cluster e anexá-lo ao Workspace. O EMR Studio demorará alguns minutos para criar o cluster. Se você usar a caixa de diálogo Criar um Workspace, escolha Criar um Workspace para criar o Workspace e provisionar o cluster. Depois que o EMR Studio provisiona o novo cluster, ele anexa o cluster ao seu Workspace.

Desanexar uma computação de um Workspace do EMR Studio

Para trocar o cluster anexado a um Workspace, é possível desanexar um cluster da interface do usuário do Workspace.

Desanexar um cluster de um Workspace
  1. No Workspace que você deseja desanexar de um cluster, escolha o ícone Clusters do EMR na barra lateral à esquerda para abrir o painel Cluster.

  2. Em Selecionar cluster, escolha Desanexar e aguarde até que o EMR Studio desanexe o cluster. Quando o cluster for desanexado, você visualizará uma mensagem de êxito.

Para desanexar uma aplicação do EMR Serverless de um Workspace do EMR Studio

Para trocar a computação anexada a um Workspace, é possível desanexar a aplicação da interface do usuário do Workspace.

  1. No Workspace que você deseja desanexar de um cluster, escolha o ícone Computação do Amazon EMR na barra lateral à esquerda para abrir o painel Computação.

  2. Em Selecionar computação, escolha Desanexar e aguarde até que o EMR Studio desanexe a aplicação. Quando a aplicação for desanexada, você visualizará uma mensagem de êxito.