As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Configurar um cluster Slurm no Studio
As instruções a seguir descrevem como configurar um cluster HyperPod Slurm no Studio.
-
Crie um domínio ou tenha um pronto. Para obter informações sobre como criar um domínio, consulteGuia para se configurar com o Amazon SageMaker AI.
-
(Opcional) Crie e anexe um volume personalizado FSx para o Lustre ao seu domínio.
-
Certifique-se de que seu sistema de arquivos FSx Lustre exista na mesma VPC do domínio pretendido e esteja em uma das sub-redes presentes no domínio.
-
Você pode seguir as instruções emComo adicionar um sistema de arquivos personalizado a um domínio.
-
-
(Opcional) Recomendamos que você adicione tags aos seus clusters para garantir um fluxo de trabalho mais tranquilo. Para obter informações sobre como adicionar tags, consulte Como Editar um SageMaker HyperPod cluster atualizar seu cluster usando o console de SageMaker IA.
-
Marque seu sistema de arquivos FSx for Lustre no seu domínio do Studio. Isso ajudará você a identificar o sistema de arquivos ao iniciar seus espaços do Studio. Para fazer isso, adicione a seguinte tag ao seu cluster para identificá-lo com o ID do FSx sistema de arquivos,.
fs-id
Chave da etiqueta = “
hyperpod-cluster-filesystem
”, Valor da etiqueta = “fs-id
”. -
Marque seu espaço de trabalho Amazon Managed Grafana com seu domínio Studio. Isso será usado para se vincular rapidamente ao seu espaço de trabalho do Grafana diretamente do seu cluster no Studio. Para fazer isso, adicione a seguinte tag ao seu cluster para identificá-la com seu ID do espaço de trabalho Grafana,.
ws-id
Chave da etiqueta = “
grafana-workspace
”, Valor da etiqueta = “ws-id
”.
-
-
Adicione a seguinte permissão à sua função de execução.
Para obter informações sobre funções de execução de SageMaker IA e como editá-las, consulteCompreendendo as permissões de espaço e os perfis de execução do domínio.
Para saber como anexar políticas a um usuário ou grupo do IAM, consulte Adicionar e remover permissões de identidade do IAM.
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "ssm:StartSession", "ssm:TerminateSession" ], "Resource": "*" }, { "Effect": "Allow", "Action": [ "sagemaker:CreateCluster", "sagemaker:ListClusters" ], "Resource": "*" }, { "Effect": "Allow", "Action": [ "cloudwatch:PutMetricData", "cloudwatch:GetMetricData" ], "Resource": "*" }, { "Effect": "Allow", "Action": [ "sagemaker:DescribeCluster", "sagemaker:DescribeClusterNode", "sagemaker:ListClusterNodes", "sagemaker:UpdateCluster", "sagemaker:UpdateClusterSoftware" ], "Resource": "arn:aws:sagemaker:
region
:account-id
:cluster/*" } ] } -
Adicione uma tag a essa função do IAM, com Tag Key = “
SSMSessionRunAs
” e Tag Value = “os user
”.os user
Aqui está o mesmo usuário que você configurou para o cluster Slurm. Gerencie o acesso aos SageMaker HyperPod clusters em uma função do IAM ou nível de usuário usando o recurso Run As no AWS Systems Manager Agent (SSM Agent). Com esse recurso, você pode iniciar cada sessão de SSM usando o usuário do sistema operacional (OS) associado à função ou ao usuário do IAM.Para obter informações sobre como adicionar tags à sua função de execução, consulte Funções do Tag IAM.
-
Ative o suporte Run As para nós gerenciados em Linux e macOS. As configurações Run As abrangem toda a conta e são necessárias para que todas as sessões de SSM sejam iniciadas com êxito.
-
(Opcional)Restringir a visualização de tarefas no Studio for Slurm clusters. Para obter informações sobre tarefas visíveis no Studio, consulteTarefas.
No Amazon SageMaker Studio, você pode navegar para visualizar seus clusters em HyperPod clusters (em Compute).
Restringir a visualização de tarefas no Studio for Slurm clusters
Você pode restringir os usuários a visualizar tarefas do Slurm que estão autorizadas a visualizar, sem exigir a entrada manual de namespaces ou verificações adicionais de permissões. A restrição é aplicada com base na função do IAM dos usuários, fornecendo uma experiência de usuário simplificada e segura. A seção a seguir fornece informações sobre como restringir a exibição de tarefas nos clusters do Studio for Slurm. Para obter informações sobre tarefas visíveis no Studio, consulteTarefas.
Todos os usuários do Studio podem visualizar, gerenciar e interagir com todas as tarefas do cluster Slurm por padrão. Para restringir isso, você pode gerenciar o acesso aos SageMaker HyperPod clusters em uma função do IAM ou nível de usuário usando o recurso Run As no AWS Systems Manager Agent (SSM Agent).
Você pode fazer isso marcando as funções do IAM com identificadores específicos, como nome de usuário ou grupo. Quando um usuário acessa o Studio, o Session Manager usa o recurso Run As para executar comandos como uma conta de usuário específica do Slurm que corresponda às tags de função do IAM. A configuração do Slurm pode ser configurada para limitar a visibilidade da tarefa com base na conta do usuário. A interface do usuário do Studio filtrará automaticamente as tarefas visíveis para essa conta de usuário específica quando os comandos forem executados por meio do recurso Executar como. Depois de configuradas, cada usuário que assumir a função com os identificadores especificados terá essas tarefas do Slurm filtradas com base na configuração do Slurm. Para obter informações sobre como adicionar tags à sua função de execução, consulte Funções do Tag IAM.