Anexar uma computação a um Workspace do EMR Studio - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Anexar uma computação a um Workspace do EMR Studio

O Amazon EMR Studio executa comandos de cadernos usando um kernel em um cluster do EMR. Antes de selecionar um kernel, você deve anexar o espaço de trabalho a um cluster que usa EC2 instâncias da Amazon, a um cluster do Amazon EMR no EKS ou a um aplicativo EMR Serverless. O EMR Studio permite anexar Workspaces a clusters novos ou existentes, e oferece flexibilidade para alterar clusters sem a necessidade de fechar o Workspace.

Esta seção aborda os seguintes tópicos para ajudar você a trabalhar e provisionar clusters para o EMR Studio:

Anexar um EC2 cluster da Amazon a um espaço de trabalho do EMR Studio

Você pode anexar um cluster do EMR em execução na Amazon EC2 a um espaço de trabalho ao criar o espaço de trabalho ou anexar um cluster a um espaço de trabalho existente. Se você desejar criar e anexar um novo cluster, consulte Criar e anexar um novo cluster do EMR a um Workspace do EMR Studio.

nota

Um espaço de trabalho em um Studio que tenha a propagação de identidade confiável do Centro de Identidade do IAM habilitada só pode ser anexado a um cluster do EMR com uma configuração de segurança que tenha o Centro de Identidade habilitado.

On create
Anexação a um cluster de computação do Amazon EMR ao criar um Workspace
  1. Na caixa de diálogo Criar um Workspace, certifique-se de já ter selecionado uma sub-rede para o novo Workspace. Expanda a seção Configuração avançada.

  2. Escolha Anexar Workspace a um cluster do EMR.

  3. Na lista suspensa Cluster do EMR, selecione um cluster do EMR existente para anexar ao Workspace.

Depois de anexar um cluster, conclua a criação do Workspace. Ao abrir o novo Workspace pela primeira vez e escolher o painel Clusters do EMR, você deverá visualizar o cluster selecionado anexado.

On launch
Anexação a um cluster de computação do Amazon EMR ao iniciar o Workspace
  1. Navegue até a lista Workspaces e selecione a linha do Workspace que você deseja iniciar. Em seguida, selecione Iniciar o Workspace > Iniciar com opções.

  2. Escolha um cluster do EMR para anexar ao seu Workspace.

Depois de anexar um cluster, conclua a criação do Workspace. Ao abrir o novo Workspace pela primeira vez e escolher o painel Clusters do EMR, você deverá visualizar o cluster selecionado anexado.

In JupyterLab
Anexe um espaço de trabalho a um cluster computacional do Amazon EMR em JupyterLab
  1. Selecione seu Workspace e, em seguida, escolha Iniciar o Workspace > Início rápido.

  2. Dentro JupyterLab, abra a guia Cluster na barra lateral esquerda.

  3. Selecione o menu suspenso EMR no EC2 cluster ou selecione um cluster do Amazon EMR no EKS.

  4. Selecione Anexar para anexar o cluster ao seu Workspace.

Depois de anexar o cluster, conclua a criação do Workspace. Ao abrir o novo Workspace pela primeira vez e escolher o painel Clusters do EMR, você deverá visualizar o cluster selecionado anexado.

In the Workspace UI
Anexação de um Workspace a um cluster de computação do Amazon EMR usando a interface do usuário do Workspace
  1. No Workspace que você deseja anexar a um cluster, escolha o ícone Clusters do EMR na barra lateral à esquerda para abrir o painel Cluster.

  2. Em Tipo de cluster, expanda a lista suspensa e selecione o cluster EMR ativado. EC2

  3. Escolha um cluster na lista suspensa. Pode ser necessário desanexar um cluster existente primeiro para habilitar a lista suspensa de seleção de cluster.

  4. Escolha Anexar. Quando o cluster for anexado, você visualizará uma mensagem de êxito.

Anexar um cluster do Amazon EMR no EKS a um Workspace do EMR Studio

Além de usar clusters do Amazon EMR em execução na Amazon EC2, você pode anexar um espaço de trabalho a um cluster do Amazon EMR no EKS para executar o código do notebook. Para obter mais informações sobre o Amazon EMR no EKS, consulte O que é o Amazon EMR no EKS?.

Antes de conectar um Workspace a um cluster do Amazon EMR no EKS, o administrador do Studio deve conceder a você as permissões de acesso.

nota

Não é possível executar um cluster do Amazon EMR no EKS em um EMR Studio que usa a propagação de identidade confiável do Centro de Identidade do IAM.

On create
Anexar um cluster do Amazon EMR no EKS ao criar um Workspace
  1. Na caixa de diálogo Criar um Workspace, expanda a seção Configuração avançada.

  2. Escolha Anexar Workspace a um cluster do Amazon EMR no EKS.

  3. Em Cluster do Amazon EMR no EKS, escolha um cluster na lista suspensa.

  4. Em Selecionar um endpoint, escolha um endpoint gerenciado para anexar ao Workspace. Um endpoint gerenciado corresponde a um gateway que permite que o EMR Studio se comunique com o cluster escolhido.

  5. Escolha Criar um Workspace para concluir o processo de criação do Workspace e anexar o cluster selecionado.

Depois de anexar um cluster, você poderá concluir o processo de criação do Workspace. Ao abrir o novo Workspace pela primeira vez e escolher o painel Clusters do EMR, você visualizará que o cluster selecionado está anexado.

In the Workspace UI
Anexar um cluster do Amazon EMR no EKS usando a interface do usuário do Workspace
  1. No Workspace que você deseja anexar a um cluster, escolha o ícone Clusters do EMR na barra lateral à esquerda para abrir o painel Cluster.

  2. Expanda o menu suspenso Tipo de cluster e escolha Clusters do EMR no EKS.

  3. Em Cluster do EMR no EKS, escolha um cluster na lista suspensa.

  4. Em Endpoint, escolha um endpoint gerenciado para anexar ao Workspace. Um endpoint gerenciado corresponde a um gateway que permite que o EMR Studio se comunique com o cluster escolhido.

  5. Escolha Anexar. Quando o cluster for anexado, você visualizará uma mensagem de êxito.

Anexar uma aplicação do Amazon EMR Serverless a um Workspace do EMR Studio

É possível conectar um Workspace a uma aplicação do EMR Serverless para executar workloads interativas. Para obter mais informações, consulte Usar cadernos para executar workloads interativas com o EMR Serverless por meio do EMR Studio.

nota

Não é possível anexar uma aplicação do EMR Sem Servidor ao EMR Studio que usa propagação de identidade confiável do Centro de Identidade do IAM.

exemplo Conecte um espaço de trabalho a um aplicativo EMR Serverless no JupyterLab

Antes de conectar um Workspace a uma aplicação do EMR Serverless, o administrador da conta deve conceder permissões de acesso conforme descrito em Permissões obrigatórias para workloads interativas.

  1. Navegue para o EMR Studio, selecione seu Workspace e, em seguida, escolha Iniciar o Workspace > Início rápido.

  2. Dentro JupyterLab, abra a guia Cluster na barra lateral esquerda.

  3. Selecione EMR Serverless como opção de computação e, em seguida, selecione uma aplicação do EMR Serverless e uma função de runtime.

  4. Selecione Anexar para anexar o cluster ao seu Workspace.

Agora, ao abrir esse Workspace, você deverá ver a aplicação selecionada anexada.

Criar e anexar um novo cluster do EMR a um Workspace do EMR Studio

Usuários avançados do EMR Studio podem provisionar novos clusters do EMR em execução na Amazon EC2 para uso com um espaço de trabalho. O novo cluster tem todas as aplicações de big data obrigatórias para o EMR Studio instaladas por padrão.

Para criar clusters, primeiro é necessário que o administrador do Studio conceda permissão a você usando uma política de sessão. Para obter mais informações, consulte Criação de políticas de permissões para usuários do EMR Studio.

Você pode criar um novo cluster na caixa de diálogo Criar um Workspace ou no painel Cluster na interface do usuário do Workspace. De qualquer forma, você tem duas opções de criação de cluster:

  1. Crie um cluster EMR — Crie um cluster EMR escolhendo o tipo e a contagem de EC2 instâncias da Amazon.

  2. Usar um modelo de cluster: provisione um cluster ao selecionar um modelo de cluster definido previamente. Esta opção aparece se você tiver permissão para usar os modelos de cluster.

    nota

    Se você habilitou a propagação de identidade confiável com o Centro de Identidade do IAM para o seu Studio, deverá usar um modelo para criar um cluster.

Criar um cluster do EMR ao fornecer uma configuração de cluster
  1. Escolha um ponto de partida.

    Para... Fazer isso...
    Criar o cluster ao criar um Workspace com a caixa de diálogo Criar um Workspace. Expanda a seção Configuração avançada na caixa de diálogo Criar um Workspace e selecione Criar um cluster do EMR.
    Criar o cluster usando o painel Cluster do EMR na interface do usuário do Workspace após criar um Workspace. Escolha a guia Clusters do EMR na barra lateral à esquerda de um Workspace, expanda a seção Configuração avançada e escolha Criar cluster.
  2. Insira um Nome de cluster. Nomear o cluster ajuda você a encontrá-lo posteriormente na lista Clusters do EMR Studio.

  3. Na Versão do Amazon EMR, escolha uma versão de liberação do Amazon EMR para o cluster.

  4. Em Instance, selecione o tipo e o número de EC2 instâncias da Amazon para o cluster. Para obter mais informações sobre como selecionar os tipos de instância, consulte Configurar tipos de EC2 instância da Amazon para uso com o Amazon EMR. Uma instância será usada como nó primário.

  5. Selecione uma Sub-rede na qual o EMR Studio possa iniciar o novo cluster. Cada opção de sub-rede é aprovada previamente pelo administrador do Studio, e seu Workspace deve ser capaz de se conectar a um cluster em qualquer sub-rede listada.

  6. Escolha um URI do S3 para o armazenamento de log.

  7. Escolha Criar cluster do EMR para provisionar o cluster. Se você usar a caixa de diálogo Criar um Workspace, escolha Criar um Workspace para criar o Workspace e provisionar o cluster. Depois que o EMR Studio provisiona o novo cluster, ele anexa o cluster ao Workspace.

Criar um cluster usando um modelo de cluster
  1. Escolha um ponto de partida.

    Para... Fazer isso...
    Criar o cluster ao criar um Workspace com a caixa de diálogo Criar um Workspace. Expanda a seção Configuração avançada na caixa de diálogo Criar um Workspace e selecione Usar um modelo de cluster.
    Criar o cluster usando o painel Cluster do EMR na interface do usuário do Workspace. Escolha a guia Clusters do EMR na barra lateral à esquerda de um Workspace, expanda a seção Configuração avançada e, em seguida, selecione Modelo de cluster.
  2. Selecione um modelo de cluster na lista suspensa. Cada modelo de cluster disponível inclui uma breve descrição para ajudar você a fazer uma seleção.

  3. O modelo de cluster escolhido pode ter parâmetros adicionais, como a versão de liberação do Amazon EMR ou o nome do cluster. Você pode escolher ou inserir valores, ou usar os valores padrão selecionados pelo administrador.

  4. Selecione uma Sub-rede na qual o EMR Studio possa iniciar o novo cluster. Cada opção de sub-rede é aprovada previamente pelo administrador do Studio, e seu Workspace deve ser capaz de se conectar a um cluster em qualquer sub-rede.

  5. Escolha Usar modelo de cluster para provisionar o cluster e anexá-lo ao Workspace. O EMR Studio demorará alguns minutos para criar o cluster. Se você usar a caixa de diálogo Criar um Workspace, escolha Criar um Workspace para criar o Workspace e provisionar o cluster. Depois que o EMR Studio provisiona o novo cluster, ele anexa o cluster ao seu Workspace.

Desanexar uma computação de um Workspace do EMR Studio

Para trocar o cluster anexado a um Workspace, é possível desanexar um cluster da interface do usuário do Workspace.

Desanexar um cluster de um Workspace
  1. No Workspace que você deseja desanexar de um cluster, escolha o ícone Clusters do EMR na barra lateral à esquerda para abrir o painel Cluster.

  2. Em Selecionar cluster, escolha Desanexar e aguarde até que o EMR Studio desanexe o cluster. Quando o cluster for desanexado, você visualizará uma mensagem de êxito.

Para desanexar uma aplicação do EMR Serverless de um Workspace do EMR Studio

Para trocar a computação anexada a um Workspace, é possível desanexar a aplicação da interface do usuário do Workspace.

  1. No Workspace que você deseja desanexar de um cluster, escolha o ícone Computação do Amazon EMR na barra lateral à esquerda para abrir o painel Computação.

  2. Em Selecionar computação, escolha Desanexar e aguarde até que o EMR Studio desanexe a aplicação. Quando a aplicação for desanexada, você visualizará uma mensagem de êxito.