SageMaker HyperPod administración de clústeres - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

SageMaker HyperPod administración de clústeres

Los siguientes temas tratan sobre el registro y la administración de SageMaker HyperPod clústeres.

Registro de SageMaker HyperPod eventos

Todos los eventos y registros de SageMaker HyperPod se guardan en Amazon CloudWatch con el nombre del grupo de registros/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]. Cada llamada a la API CreateCluster crea un nuevo grupo de registro. En la siguiente lista se incluyen todos los flujos de registro disponibles recopilados en cada grupo de registro.

Nombre del grupo de registro Nombre del flujo de registro
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] LifecycleConfig/[instance-group-name]/[instance-id]

Registro SageMaker HyperPod a nivel de instancia

Puede acceder a los LifecycleScript registros publicados CloudWatch durante la configuración de la instancia del clúster. Cada instancia del clúster creado genera un flujo de registro independiente, que se distingue por el formato LifecycleConfig/[instance-group-name]/[instance-id].

Todos los registros en los que se escriben /var/log/provision/provisioning.log se cargan en la CloudWatch transmisión anterior. Ejemplo LifecycleScripts de cómo 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-configredirigir sus stdout y stderr a esta ubicación. Si está utilizando sus scripts personalizados, escriba sus registros en la /var/log/provision/provisioning.log ubicación en la que estén disponibles CloudWatch.

Etiquetado de recursos

AWS El sistema de etiquetado ayuda a administrar, identificar, organizar, buscar y filtrar los recursos. SageMaker HyperPod admite el etiquetado, por lo que puede administrar los clústeres como un AWS recurso. Durante la creación o edición de un clúster existente, puede añadir o editar etiquetas para el clúster. Para obtener más información sobre el etiquetado en general, consulte Tagging your AWS resources.

Uso de la interfaz de usuario de la SageMaker HyperPod consola

Al creare un clúster nuevo y editar un clúster, puede añadir, eliminar o editar etiquetas.

Uso del SageMaker HyperPod APIs

Cuando escribas un archivo de solicitud de UpdateClusterAPI CreateClustero un archivo de solicitud de API en formato JSON, edita la Tags sección.

Uso de los comandos AWS CLI de etiquetado para IA SageMaker

Etiquetado de un clúster

Utilice aws sagemaker add-tags de la siguiente manera.

aws sagemaker add-tags --resource-arn cluster_ARN --tags Key=string,Value=string

Eliminación de etiquetado de un clúster

Utilice aws sagemaker delete-tags de la siguiente manera.

aws sagemaker delete-tags --resource-arn cluster_ARN --tag-keys "tag_key"

Enumeración de etiquetadas de un recurso

Utilice aws sagemaker list-tags de la siguiente manera.

aws sagemaker list-tags --resource-arn cluster_ARN