SageMaker HyperPod gerenciamento de clusters - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

SageMaker HyperPod gerenciamento de clusters

Os tópicos a seguir abordam o registro e o gerenciamento de SageMaker HyperPod clusters.

Registrando SageMaker HyperPod eventos

Todos os eventos e registros de SageMaker HyperPod são salvos na Amazon CloudWatch com o nome do grupo de registros/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]. Cada chamada para a CreateCluster API cria um novo grupo de registros. A lista a seguir contém todos os fluxos de log disponíveis coletados em cada grupo de logs.

Nome do grupo de registros Nome do fluxo de log
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] LifecycleConfig/[instance-group-name]/[instance-id]

Registro SageMaker HyperPod em nível de instância

Você pode acessar os LifecycleScript registros publicados CloudWatch durante a configuração da instância do cluster. Cada instância dentro do cluster criado gera um fluxo de log separado, diferenciável pelo LifecycleConfig/[instance-group-name]/[instance-id] formato.

Todos os registros gravados /var/log/provision/provisioning.log são enviados para o CloudWatch stream anterior. Amostra LifecycleScripts ao 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-configredirecionar suas stdout e stderr para este local. Se você estiver usando seus scripts personalizados, grave seus registros no /var/log/provision/provisioning.log local em que eles estejam disponíveis CloudWatch.

Marcar recursos

AWS O sistema de marcação ajuda a gerenciar, identificar, organizar, pesquisar e filtrar recursos. SageMaker HyperPod oferece suporte à marcação, para que você possa gerenciar os clusters como um AWS recurso. Durante a criação do cluster ou a edição de um cluster existente, você pode adicionar ou editar tags para o cluster. Para saber mais sobre a marcação em geral, consulte Como marcar seus AWS recursos.

Usando a interface do usuário SageMaker HyperPod do console

Ao criar um novo cluster e editar um cluster, você pode adicionar, remover ou editar tags.

Usando as SageMaker HyperPod APIs

Ao escrever um arquivo de solicitação de UpdateClusterAPI CreateClusterou de API no formato JSON, edite a Tags seção.

Usando os comandos de AWS CLI marcação para SageMaker

Para marcar um cluster

Use da aws sagemaker add-tagsseguinte forma.

aws sagemaker add-tags --resource-arn cluster_ARN --tags Key=string,Value=string

Para desmarcar um cluster

Use da aws sagemaker delete-tagsseguinte forma.

aws sagemaker delete-tags --resource-arn cluster_ARN --tag-keys "tag_key"

Para listar tags para um recurso

Use da aws sagemaker list-tagsseguinte forma.

aws sagemaker list-tags --resource-arn cluster_ARN