Anexar uma computação a um espaço de trabalho do EMR Studio - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Anexar uma computação a um espaço de trabalho do EMR Studio

O Amazon EMR Studio executa comandos do notebook usando um kernel em um EMR cluster. Antes de selecionar um kernel, você deve anexar o espaço de trabalho a um cluster que usa EC2 instâncias da Amazon, a um EKS cluster Amazon EMR on ou a um aplicativo sem EMR servidor. EMRO Studio permite anexar espaços de trabalho a clusters novos ou existentes e oferece a flexibilidade de alterar os clusters sem fechar o espaço de trabalho.

Esta seção aborda os tópicos a seguir para ajudá-lo a trabalhar e provisionar clusters para o EMR Studio:

Anexar um EC2 cluster da Amazon a um EMR Studio Workspace

Você pode anexar um EMR cluster em execução na Amazon EC2 a um espaço de trabalho ao criar o espaço de trabalho ou anexar um cluster a um espaço de trabalho existente. Se você desejar criar e anexar um novo cluster, consulte Crie e anexe um novo EMR cluster a um EMR Studio Workspace.

nota

Um espaço de trabalho em um Studio que tenha a propagação de IAM identidade confiável do Identity Center ativada só pode ser anexada a um EMR cluster com uma configuração de segurança que tenha o Identity Center ativado.

On create
Conecte-se a um cluster de EMR computação da Amazon ao criar um espaço de trabalho
  1. Na caixa de diálogo Criar um Workspace, certifique-se de já ter selecionado uma sub-rede para o novo Workspace. Expanda a seção Configuração avançada.

  2. Escolha Anexar espaço de trabalho a um EMR cluster.

  3. Na lista suspensa do EMRcluster, selecione um EMR cluster existente para anexar ao espaço de trabalho.

Depois de anexar um cluster, conclua a criação do Workspace. Ao abrir o novo espaço de trabalho pela primeira vez e escolher o painel de EMRclusters, você deverá ver o cluster selecionado anexado.

On launch
Conecte-se a um cluster de EMR computação da Amazon ao iniciar o Workspace
  1. Navegue até a lista Workspaces e selecione a linha do Workspace que você deseja iniciar. Em seguida, selecione Iniciar o Workspace > Iniciar com opções.

  2. Escolha um EMR cluster para anexar ao seu espaço de trabalho.

Depois de anexar um cluster, conclua a criação do Workspace. Ao abrir o novo espaço de trabalho pela primeira vez e escolher o painel de EMRclusters, você deverá ver o cluster selecionado anexado.

In JupyterLab
Anexe um espaço de trabalho a um cluster de EMR computação da Amazon em JupyterLab
  1. Selecione seu Workspace e, em seguida, escolha Iniciar o Workspace > Início rápido.

  2. Dentro JupyterLab, abra a guia Cluster na barra lateral esquerda.

  3. Selecione o menu suspenso EMRon EC2 cluster ou selecione um Amazon EMR on EKS cluster.

  4. Selecione Anexar para anexar o cluster ao seu Workspace.

Depois de anexar o cluster, conclua a criação do Workspace. Ao abrir o novo espaço de trabalho pela primeira vez e escolher o painel de EMRclusters, você deverá ver o cluster selecionado anexado.

In the Workspace UI
Anexe um espaço de trabalho a um cluster de EMR computação da Amazon a partir da interface de usuário do Workspace
  1. No espaço de trabalho que você deseja anexar a um cluster, escolha o ícone de EMRclusters na barra lateral esquerda para abrir o painel Cluster.

  2. Em Tipo de cluster, expanda a lista suspensa e selecione EMRcluster ativado. EC2

  3. Escolha um cluster na lista suspensa. Pode ser necessário desanexar um cluster existente primeiro para habilitar a lista suspensa de seleção de cluster.

  4. Escolha Anexar. Quando o cluster for anexado, você visualizará uma mensagem de êxito.

Anexar um EKS cluster Amazon EMR on a um EMR Studio Workspace

Além de usar EMR clusters da Amazon em execução na AmazonEC2, você pode anexar um espaço de trabalho a um EKS cluster Amazon EMR on para executar o código do notebook. Para obter mais informações sobre a Amazon EMR onEKS, consulte What is Amazon EMR on EKS.

Antes de conectar um espaço de trabalho a um EKS cluster Amazon EMR on, o administrador do Studio deve conceder a você permissões de acesso.

nota

Você não pode iniciar um EKS cluster Amazon EMR on em um EMR Studio que usa a propagação de IAM identidade confiável do Identity Center.

On create
Para anexar um Amazon EMR em um EKS cluster ao criar um espaço de trabalho
  1. Na caixa de diálogo Criar um Workspace, expanda a seção Configuração avançada.

  2. Escolha Anexar espaço de trabalho a um Amazon EMR on EKS cluster.

  3. Em Amazon EMR on EKS cluster, escolha um cluster na lista suspensa.

  4. Em Selecionar um endpoint, escolha um endpoint gerenciado para anexar ao Workspace. Um endpoint gerenciado é um gateway que permite que o EMR Studio se comunique com o cluster escolhido.

  5. Escolha Criar um Workspace para concluir o processo de criação do Workspace e anexar o cluster selecionado.

Depois de anexar um cluster, você poderá concluir o processo de criação do Workspace. Ao abrir o novo espaço de trabalho pela primeira vez e escolher o painel de EMRclusters, você verá que o cluster selecionado está anexado.

In the Workspace UI
Para anexar um EKS cluster Amazon EMR on a partir da interface de usuário do Workspace
  1. No espaço de trabalho que você deseja anexar a um cluster, escolha o ícone de EMRclusters na barra lateral esquerda para abrir o painel Cluster.

  2. Expanda a lista suspensa Tipo de cluster e escolha EMRclusters em. EKS

  3. Em EMRcluster ativado EKS, escolha um cluster na lista suspensa.

  4. Em Endpoint, escolha um endpoint gerenciado para anexar ao Workspace. Um endpoint gerenciado é um gateway que permite que o EMR Studio se comunique com o cluster escolhido.

  5. Escolha Anexar. Quando o cluster for anexado, você visualizará uma mensagem de êxito.

Anexe um aplicativo Amazon EMR Serverless a um Studio Workspace EMR

Você pode anexar um espaço de trabalho a um aplicativo EMR sem servidor para executar cargas de trabalho interativas. Para obter mais informações, consulte Usando notebooks para executar cargas de trabalho interativas com o EMR Serverless por meio do Studio. EMR

nota

Você não pode anexar um aplicativo EMR sem servidor a um EMR Studio que usa a propagação de IAM identidade confiável do Identity Center.

exemplo Anexe um espaço de trabalho a um aplicativo EMR sem servidor no JupyterLab

Antes de conectar um espaço de trabalho a um aplicativo EMR sem servidor, o administrador da sua conta deve conceder permissões de acesso conforme descrito em Permissões obrigatórias para cargas de trabalho interativas.

  1. Navegue até o EMR Studio, selecione seu espaço de trabalho e, em seguida, selecione Launch Workspace > Início rápido.

  2. Dentro JupyterLab, abra a guia Cluster na barra lateral esquerda.

  3. Selecione EMRSem servidor como opção de computação e, em seguida, selecione um aplicativo EMR sem servidor e uma função de tempo de execução.

  4. Selecione Anexar para anexar o cluster ao seu Workspace.

Agora, ao abrir esse Workspace, você deverá ver a aplicação selecionada anexada.

Crie e anexe um novo EMR cluster a um EMR Studio Workspace

Os usuários do Advanced EMR Studio podem provisionar novos EMR clusters em execução na Amazon EC2 para uso com um espaço de trabalho. O novo cluster tem todos os aplicativos de big data necessários para o EMR Studio instalados por padrão.

Para criar clusters, primeiro é necessário que o administrador do Studio conceda permissão a você usando uma política de sessão. Para obter mais informações, consulte Crie políticas de permissões para usuários do EMR Studio.

Você pode criar um novo cluster na caixa de diálogo Criar um Workspace ou no painel Cluster na interface do usuário do Workspace. De qualquer forma, você tem duas opções de criação de cluster:

  1. Crie um EMR cluster — Crie um EMR cluster escolhendo o tipo e a contagem de EC2 instâncias da Amazon.

  2. Usar um modelo de cluster: provisione um cluster ao selecionar um modelo de cluster definido previamente. Esta opção aparece se você tiver permissão para usar os modelos de cluster.

    nota

    Se você habilitou a propagação de IAM identidade confiável com o Identity Center for your Studio, deverá usar um modelo para criar um cluster.

Para criar um EMR cluster fornecendo uma configuração de cluster
  1. Escolha um ponto de partida.

    Para... Fazer isso...
    Criar o cluster ao criar um Workspace com a caixa de diálogo Criar um Workspace. Expanda a seção Configuração avançada na caixa de diálogo Criar um espaço de trabalho e selecione Criar um EMR cluster.
    Crie o cluster a partir do painel do EMRcluster na UI do Workspace depois de criar um Workspace. Escolha a guia EMRClusters na barra lateral esquerda de um espaço de trabalho aberto, expanda a seção Configuração avançada e escolha Criar cluster.
  2. Insira um Nome de cluster. Nomear o cluster ajuda você a encontrá-lo posteriormente na lista EMR Studio Clusters.

  3. Para a EMRversão da Amazon, escolha uma EMR versão da Amazon para o cluster.

  4. Em Instance, selecione o tipo e o número de EC2 instâncias da Amazon para o cluster. Para obter mais informações sobre como selecionar os tipos de instância, consulte Configurar EC2 instâncias da Amazon. Uma instância será usada como nó primário.

  5. Selecione uma sub-rede na qual o EMR Studio possa iniciar o novo cluster. Cada opção de sub-rede é aprovada previamente pelo administrador do Studio, e seu Workspace deve ser capaz de se conectar a um cluster em qualquer sub-rede listada.

  6. Escolha um S3 URI para armazenamento de registros.

  7. Escolha Criar EMR cluster para provisionar o cluster. Se você usar a caixa de diálogo Criar um Workspace, escolha Criar um Workspace para criar o Workspace e provisionar o cluster. Depois que o EMR Studio provisiona o novo cluster, ele anexa o cluster ao espaço de trabalho.

Criar um cluster usando um modelo de cluster
  1. Escolha um ponto de partida.

    Para... Fazer isso...
    Criar o cluster ao criar um Workspace com a caixa de diálogo Criar um Workspace. Expanda a seção Configuração avançada na caixa de diálogo Criar um Workspace e selecione Usar um modelo de cluster.
    Crie o cluster a partir do painel do EMRcluster na interface do usuário do Workspace. Escolha a guia EMRClusters na barra lateral esquerda de um espaço de trabalho aberto, expanda a seção Configuração avançada e escolha Modelo de cluster.
  2. Selecione um modelo de cluster na lista suspensa. Cada modelo de cluster disponível inclui uma breve descrição para ajudar você a fazer uma seleção.

  3. O modelo de cluster que você escolher pode ter parâmetros adicionais, como a versão de EMR lançamento da Amazon ou o nome do cluster. Você pode escolher ou inserir valores, ou usar os valores padrão selecionados pelo administrador.

  4. Selecione uma sub-rede na qual o EMR Studio possa iniciar o novo cluster. Cada opção de sub-rede é aprovada previamente pelo administrador do Studio, e seu Workspace deve ser capaz de se conectar a um cluster em qualquer sub-rede.

  5. Escolha Usar modelo de cluster para provisionar o cluster e anexá-lo ao Workspace. O EMR Studio levará alguns minutos para criar o cluster. Se você usar a caixa de diálogo Criar um Workspace, escolha Criar um Workspace para criar o Workspace e provisionar o cluster. Depois que o EMR Studio provisiona o novo cluster, ele anexa o cluster ao seu espaço de trabalho.

Separar uma computação de um espaço de trabalho do Studio EMR

Para trocar o cluster anexado a um Workspace, é possível desanexar um cluster da interface do usuário do Workspace.

Desanexar um cluster de um Workspace
  1. No espaço de trabalho que você deseja separar de um cluster, escolha o ícone de EMRclusters na barra lateral esquerda para abrir o painel Cluster.

  2. Em Selecionar cluster, escolha Desanexar e aguarde até que o EMR Studio desanexe o cluster. Quando o cluster for desanexado, você visualizará uma mensagem de êxito.

Para separar um aplicativo EMR sem servidor de um Studio Workspace EMR

Para trocar a computação anexada a um Workspace, é possível desanexar a aplicação da interface do usuário do Workspace.

  1. No espaço de trabalho que você deseja separar de um cluster, escolha o ícone de EMRcomputação da Amazon na barra lateral esquerda para abrir o painel Computação.

  2. Em Selecionar computação, escolha Desanexar e aguarde até que o EMR Studio desanexe o aplicativo. Quando a aplicação for desanexada, você visualizará uma mensagem de êxito.