Usando a interface de usuário do console do SageMaker HyperPod
Os seguintes tópicos oferecem orientações sobre como gerenciar o SageMaker HyperPod por meio da interface de usuário do console:
Tópicos
Cria um cluster do SageMaker HyperPod
Consulte as instruções a seguir sobre como criar um novo cluster do SageMaker HyperPod por meio da interface do console do SageMaker HyperPod.
-
Abra o console do Amazon SageMaker em https://console.aws.amazon.com/sagemaker/
. -
No painel de navegação à esquerda, escolha Clusters do HyperPod.
-
Na página inicial do SageMaker HyperPod, escolha Criar cluster do HyperPod.
-
No menu suspenso de Criar cluster HyperPod, escolha Orchestrated by Slurm.
-
Na Etapa 1: configurações do cluster, configure as informações básicas para o cluster.
-
Em Nome do cluster, especifique o nome do seu cluster.
-
Para Tags, adicione pares de chaves e valores ao novo cluster e gerencie o cluster como um AWS recurso. Para saber mais, consulte Marcação de AWS recursos.
-
-
Na Etapa 2: Grupos de instâncias, escolha Criar grupo de instâncias. Cada grupo de instâncias pode ser configurado de forma diferente e você pode criar um cluster heterogêneo que consiste em vários grupos de instâncias com vários tipos de instância. Na janela pop-up Criar uma configuração de grupo de instâncias, preencha as informações de configuração do grupo de instâncias.
-
Em Nome do grupo de instâncias, especifique um nome para o grupo de instâncias.
-
Em Selecionar tipo de instância, escolha a instância para o grupo de instâncias.
-
Em Quantidade, especifique um número inteiro que não exceda a cota de instância para uso do cluster.
-
Para o caminho do Amazon S3 para arquivos de script de ciclo de vida, insira o caminho do S3 no qual seus scripts de ciclo de vida são armazenados.
-
Em Caminho do diretório para seu script de ciclo de vida ao ser criado, insira o nome do arquivo do script de ciclo de vida em Caminho do S3 para arquivos de script de ciclo de vida.
-
Para o perfil do IAM, escolha o perfil do IAM que você criou para os atributos do SageMaker HyperPod, seguindo a seção AWS Identity and Access Management para SageMaker HyperPod.
-
Em Configuração avançada, você pode definir as seguintes configurações opcionais:
-
(Opcional) Para Threads por núcleo, especifique
1
para desativar o multithreading e2
para habilitar o multithreading. Para descobrir qual tipo de instância oferece apoio a multithreading, consulte a tabela de referência de núcleos de CPU e threads por núcleo de CPU por tipo de instância no Guia do usuário do Amazon EC2. -
(Opcional) Para Configurações adicionais de armazenamento de instâncias, especifique um número inteiro entre 1 e 16384 para definir o tamanho de um volume adicional do Elastic Block Store (EBS) em gigabytes (GB). O volume do EBS é anexado a cada instância do grupo de instâncias. O caminho de montagem padrão para o volume adicional do EBS é
/opt/sagemaker
. Depois que o cluster for criado com sucesso, você poderá entrar por SSH nas instâncias do cluster (nós) e verificar se o volume do EBS está montado corretamente executando o comandodf -h
. A anexação de um volume adicional do EBS fornece armazenamento estável, fora da instância e com persistência independente, conforme descrito na seção de volumes do Amazon EBS no Guia do usuário do Amazon Elastic Block Store.
-
-
-
Na Etapa 3: Configuração avançada, defina as configurações de rede opcionais dentro do cluster e dentro e fora do cluster. Selecione sua própria VPC se você já tiver uma que dê ao SageMaker acesso aos seus recursos na VPC. Se você quiser criar uma nova VPC, consulte Criar uma VPC padrão ou Criar uma VPC no Guia do usuário da Amazon Virtual Private Cloud. Se você não fizer nenhuma seleção, será selecionada a VPC padrão da sua conta.
nota
Se quiser usar sua própria VPC, adicione permissões adicionais ao perfil do IAM para clusters do SageMaker HyperPod. Para saber mais, consulte Como configurar o SageMaker HyperPod com a Amazon VPC.
-
Na Etapa 4: Revisar e criar, revise a configuração que você definiu da Etapa 1 à Etapa 3 e conclua o envio da solicitação de criação do cluster.
-
Depois que o status do cluster mudar para
InService
, você poderá começar a fazer login nos nós do cluster. Para acessar os nós do cluster e começar a executar workloads de ML, consulte Trabalhos em clusters do SageMaker HyperPod.
Procure seus clusters do SageMaker HyperPod
Em Clusters na página principal do console do SageMaker HyperPod, todos os clusters criados devem aparecer relacionados na seção Clusters, que fornece uma visão resumida dos clusters, seus ARNs, status e horário de criação.
Exibir detalhes de cada cluster do SageMaker HyperPod
Em Clusters na página principal do console, os nomes dos clusters são ativados como links. Escolha o link do nome do cluster para ver os detalhes de cada cluster.
Editar um cluster do SageMaker HyperPod
-
Selecione Clusters e escolha o cluster que deseja atualizar.
-
Escolha o botão Ações e escolha Editar cluster.
-
Na página Editar <your-cluster>, você pode editar as configurações dos grupos de instâncias existentes, adicionar mais grupos de instâncias e alterar as tags do cluster. Depois de fazer suas alterações, escolha Avançar. Observe que, atualmente, você não pode reduzir ou excluir grupos de instâncias existentes.
-
Na seção Configurar grupos de instâncias, você pode adicionar mais grupos de instâncias escolhendo Criar grupo de clusters.
-
Na seção Configurar grupos de instâncias, você pode escolher um dos grupos de instâncias e escolher Editar para alterar sua configuração.
-
Na seção Marcações, você pode atualizar as marcações do cluster.
-
Excluir um cluster do SageMaker HyperPod
-
Na lista Clusters, escolha o cluster que você deseja excluir.
-
Escolha Ações e Excluir cluster.
-
Na janela pop-up para exclusão do cluster, revise cuidadosamente as informações do cluster para confirmar se você escolheu o cluster certo para excluir.
-
Depois de analisar as informações do cluster, escolha Sim, excluir cluster.
-
Insira
delete
no campo de texto para confirmar a exclusão. -
Escolha Excluir no canto inferior direito da janela pop-up para concluir o envio da solicitação de exclusão do cluster.