SageMaker HyperPod referências - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

SageMaker HyperPod referências

Encontre mais informações e referências sobre o uso SageMaker HyperPod nos tópicos a seguir.

SageMaker HyperPod preços

Os tópicos a seguir fornecem informações sobre SageMaker HyperPod preços. Para encontrar mais detalhes sobre o preço por hora do uso de SageMaker HyperPod instâncias, consulte também os SageMaker preços da Amazon.

Solicitações de capacidade

Você pode alocar capacidade computacional sob demanda ou reservada SageMaker para uso em. SageMaker HyperPod A criação de clusters sob demanda aloca a capacidade disponível do pool de capacidade sob SageMaker demanda. Como alternativa, você pode solicitar capacidade reservada para garantir o acesso enviando um ticket para aumentar a cota. As solicitações de capacidade de entrada são priorizadas SageMaker e você recebe um tempo estimado para alocação de capacidade.

Faturamento de serviços

Ao provisionar uma capacidade computacional SageMaker HyperPod, você é cobrado pela duração da alocação de capacidade. SageMaker HyperPod o faturamento aparece em suas faturas de aniversário com um item de linha para o tipo de alocação de capacidade (sob demanda, reservada), o tipo de instância e o tempo gasto no uso da instância.

Para enviar um ticket para um aumento de cota, consulteSageMaker HyperPod cotas.

SageMaker HyperPod APIs

A lista a seguir é um conjunto completo de SageMaker HyperPod APIs para enviar solicitações de ação em JSON formato por meio de SageMaker AWS CLI ou AWS SDK for Python (Boto3).

SageMaker HyperPod formulários

Para configurar a ferramenta de gerenciamento de carga de trabalho do Slurm HyperPod, você deve criar um arquivo de configuração do Slurm necessário usando HyperPod o formulário fornecido.

Formulário de configuração para provisionamento de nós do Slurm em HyperPod

O código a seguir é o formulário de configuração do Slurm que você deve preparar para configurar adequadamente os nós do Slurm em seu cluster. HyperPod Você deve preencher esse formulário e carregá-lo como parte de um conjunto de scripts de ciclo de vida durante a criação do cluster. Para saber como esse formulário deve ser preparado em todos os processos de criação de HyperPod clusters, consultePersonalize SageMaker HyperPod clusters usando scripts de ciclo de vida.

// Save as provisioning_params.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "string", "login_group": "string", "worker_groups": [ { "instance_group_name": "string", "partition_name": "string" } ], "fsx_dns_name": "string", "fsx_mountname": "string" }
  • version – obrigatório. Essa é a versão do formulário de parâmetros de HyperPod provisionamento. Guarde para1.0.0.

  • workload_manager – obrigatório. Isso serve para especificar qual gerenciador de carga de trabalho deve ser configurado no HyperPod cluster. Guarde paraslurm.

  • controller_group – obrigatório. Isso serve para especificar o nome do grupo de instâncias do HyperPod cluster que você deseja atribuir ao nó do controlador (principal) do Slurm.

  • login_group: optional. Isso serve para especificar o nome do grupo de instâncias do HyperPod cluster que você deseja atribuir ao nó de login do Slurm.

  • worker_groups – obrigatório. Isso serve para configurar nós de trabalho (computação) do Slurm no cluster. HyperPod

    • instance_group_name – obrigatório. Isso serve para especificar o nome do grupo de HyperPod instâncias que você deseja atribuir ao nó de trabalho (computação) do Slurm.

    • partition_name – obrigatório. Isso serve para especificar o nome da partição para o nó.

  • fsx_dns_name: optional. Se você quiser configurar seus nós do Slurm no HyperPod cluster para se comunicar com a AmazonFSx, especifique o FSx DNS nome.

  • fsx_mountname: optional. Se você quiser configurar seus nós do Slurm no HyperPod cluster para se comunicar com a AmazonFSx, especifique o nome da FSx montagem.

SageMaker HyperPod DLAMI

SageMaker HyperPod executa um DLAMI baseado em:

SageMaker HyperPod DLAMIO vem com pacotes adicionais para oferecer suporte a ferramentas de código aberto, como Slurm, Kubernetes, dependências e pacotes de software de cluster, para oferecer suporte a recursos de resiliência, como verificação de integridade e retomada automática do SageMaker HyperPod cluster. Para acompanhar as atualizações HyperPod de software pelas quais a equipe HyperPod de serviço distribuiDLAMIs, consulteNotas SageMaker HyperPod de lançamento da Amazon.

SageMaker HyperPod APIreferência de permissões

Importante

IAMPolíticas personalizadas que permitem que o Amazon SageMaker Studio ou o Amazon SageMaker Studio Classic criem SageMaker recursos da Amazon também devem conceder permissões para adicionar tags a esses recursos. A permissão para adicionar tags aos recursos é necessária porque o Studio e o Studio Classic marcam automaticamente todos os recursos que eles criam. Se uma IAM política permitir que o Studio e o Studio Classic criem recursos, mas não permita a marcação, erros AccessDenied "" podem ocorrer ao tentar criar recursos. Para obter mais informações, consulte Forneça permissões para marcar recursos SageMaker.

AWS Políticas gerenciadas para a Amazon SageMakerque dão permissões para criar SageMaker recursos já incluem permissões para adicionar tags ao criar esses recursos.

Ao configurar o controle de acesso para permitir a execução de SageMaker HyperPod API operações e escrever uma política de permissões que você pode anexar aos IAM usuários para administradores de nuvem, use a tabela a seguir como referência.

SageMaker APIOperações da Amazon Permissões necessárias (APIações) Recursos
CreateCluster sagemaker:CreateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DeleteCluster sagemaker:DeleteCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeCluster sagemaker:DescribeCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeClusterNode sagemaker:DescribeClusterNode arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusterNodes sagemaker:ListClusterNodes arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusters sagemaker:ListClusters arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateCluster sagemaker:UpdateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateClusterSoftware sagemaker:UpdateClusterSoftware arn:aws:sagemaker:region:account-id:cluster/cluster-id

Para obter uma lista completa de permissões e tipos de recursos para SageMaker APIs, consulte Ações, recursos e chaves de condição para a Amazon SageMaker no AWS Referência de autorização de serviço.

SageMaker HyperPod comandos em AWS CLI

A seguir estão os AWS CLI comandos SageMaker HyperPod para executar as HyperPod APIoperações principais.

SageMaker HyperPod Módulos Python em AWS SDK for Python (Boto3)

A seguir estão os métodos do AWS SDK for Python (Boto3) cliente SageMaker para executar as HyperPod APIoperações principais.