As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
SageMaker HyperPod referências
Encontre mais informações e referências sobre o uso SageMaker HyperPod nos tópicos a seguir.
Tópicos
SageMaker HyperPod preços
Os tópicos a seguir fornecem informações sobre SageMaker HyperPod preços. Para encontrar mais detalhes sobre o preço por hora do uso de SageMaker HyperPod instâncias, consulte também os SageMaker preços da Amazon
Solicitações de capacidade
Você pode alocar capacidade computacional sob demanda ou reservada SageMaker para uso em. SageMaker HyperPod A criação de clusters sob demanda aloca a capacidade disponível do pool de capacidade sob SageMaker demanda. Como alternativa, você pode solicitar capacidade reservada para garantir o acesso enviando um ticket para aumentar a cota. As solicitações de capacidade de entrada são priorizadas SageMaker e você recebe um tempo estimado para alocação de capacidade.
Faturamento de serviços
Ao provisionar uma capacidade computacional SageMaker HyperPod, você é cobrado pela duração da alocação de capacidade. SageMaker HyperPod o faturamento aparece em suas faturas de aniversário com um item de linha para o tipo de alocação de capacidade (sob demanda, reservada), o tipo de instância e o tempo gasto no uso da instância.
Para enviar um ticket para um aumento de cota, consulteSageMaker HyperPod cotas.
SageMaker HyperPod APIs
A lista a seguir é um conjunto completo de SageMaker HyperPod APIs para enviar solicitações de ação em JSON formato por meio de SageMaker AWS CLI ou AWS SDK for Python (Boto3).
SageMaker HyperPod formulários
Para configurar a ferramenta de gerenciamento de carga de trabalho do Slurm HyperPod, você deve criar um arquivo de configuração do Slurm necessário usando HyperPod o formulário fornecido.
Formulário de configuração para provisionamento de nós do Slurm em HyperPod
O código a seguir é o formulário de configuração do Slurm que você deve preparar para configurar adequadamente os nós do Slurm em seu cluster. HyperPod Você deve preencher esse formulário e carregá-lo como parte de um conjunto de scripts de ciclo de vida durante a criação do cluster. Para saber como esse formulário deve ser preparado em todos os processos de criação de HyperPod clusters, consultePersonalize SageMaker HyperPod clusters usando scripts de ciclo de vida.
// Save as provisioning_params.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "
string
", "login_group": "string
", "worker_groups": [ { "instance_group_name": "string
", "partition_name": "string
" } ], "fsx_dns_name": "string
", "fsx_mountname": "string
" }
-
version
– obrigatório. Essa é a versão do formulário de parâmetros de HyperPod provisionamento. Guarde para1.0.0
. -
workload_manager
– obrigatório. Isso serve para especificar qual gerenciador de carga de trabalho deve ser configurado no HyperPod cluster. Guarde paraslurm
. -
controller_group
– obrigatório. Isso serve para especificar o nome do grupo de instâncias do HyperPod cluster que você deseja atribuir ao nó do controlador (principal) do Slurm. -
login_group
: optional. Isso serve para especificar o nome do grupo de instâncias do HyperPod cluster que você deseja atribuir ao nó de login do Slurm. -
worker_groups
– obrigatório. Isso serve para configurar nós de trabalho (computação) do Slurm no cluster. HyperPod-
instance_group_name
– obrigatório. Isso serve para especificar o nome do grupo de HyperPod instâncias que você deseja atribuir ao nó de trabalho (computação) do Slurm. -
partition_name
– obrigatório. Isso serve para especificar o nome da partição para o nó.
-
-
fsx_dns_name
: optional. Se você quiser configurar seus nós do Slurm no HyperPod cluster para se comunicar com a AmazonFSx, especifique o FSx DNS nome. -
fsx_mountname
: optional. Se você quiser configurar seus nós do Slurm no HyperPod cluster para se comunicar com a AmazonFSx, especifique o nome da FSx montagem.
SageMaker HyperPod DLAMI
SageMaker HyperPod executa um DLAMI baseado em:
-
AWS Base de aprendizado profundo GPU AMI (Ubuntu 20.04)
para orquestração com o Slurm. -
Amazon Linux 2 baseado AMI para orquestração com a Amazon. EKS
SageMaker HyperPod DLAMIO vem com pacotes adicionais para oferecer suporte a ferramentas de código aberto, como Slurm, Kubernetes, dependências e pacotes de software de cluster, para oferecer suporte a recursos de resiliência, como verificação de integridade e retomada automática do SageMaker HyperPod cluster. Para acompanhar as atualizações HyperPod de software pelas quais a equipe HyperPod de serviço distribuiDLAMIs, consulteNotas SageMaker HyperPod de lançamento da Amazon.
SageMaker HyperPod APIreferência de permissões
Importante
IAMPolíticas personalizadas que permitem que o Amazon SageMaker Studio ou o Amazon SageMaker Studio Classic criem SageMaker recursos da Amazon também devem conceder permissões para adicionar tags a esses recursos. A permissão para adicionar tags aos recursos é necessária porque o Studio e o Studio Classic marcam automaticamente todos os recursos que eles criam. Se uma IAM política permitir que o Studio e o Studio Classic criem recursos, mas não permita a marcação, erros AccessDenied "" podem ocorrer ao tentar criar recursos. Para obter mais informações, consulte Forneça permissões para marcar recursos SageMaker.
AWS Políticas gerenciadas para a Amazon SageMakerque dão permissões para criar SageMaker recursos já incluem permissões para adicionar tags ao criar esses recursos.
Ao configurar o controle de acesso para permitir a execução de SageMaker HyperPod API operações e escrever uma política de permissões que você pode anexar aos IAM usuários para administradores de nuvem, use a tabela a seguir como referência.
SageMaker APIOperações da Amazon | Permissões necessárias (APIações) | Recursos |
CreateCluster | sagemaker:CreateCluster |
arn:aws:sagemaker: |
DeleteCluster | sagemaker:DeleteCluster |
arn:aws:sagemaker: |
DescribeCluster | sagemaker:DescribeCluster |
arn:aws:sagemaker: |
DescribeClusterNode | sagemaker:DescribeClusterNode |
arn:aws:sagemaker: |
ListClusterNodes | sagemaker:ListClusterNodes |
arn:aws:sagemaker: |
ListClusters | sagemaker:ListClusters |
arn:aws:sagemaker: |
UpdateCluster | sagemaker:UpdateCluster |
arn:aws:sagemaker: |
UpdateClusterSoftware | sagemaker:UpdateClusterSoftware |
arn:aws:sagemaker: |
Para obter uma lista completa de permissões e tipos de recursos para SageMaker APIs, consulte Ações, recursos e chaves de condição para a Amazon SageMaker no AWS Referência de autorização de serviço.
SageMaker HyperPod comandos em AWS CLI
A seguir estão os AWS CLI comandos SageMaker HyperPod para executar as HyperPod APIoperações principais.
SageMaker HyperPod Módulos Python em AWS SDK for Python (Boto3)
A seguir estão os métodos do AWS SDK for Python (Boto3) cliente SageMaker para executar as HyperPod APIoperações principais.