Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
SageMaker HyperPod administración de clústeres
Los siguientes temas tratan sobre el registro y la administración de SageMaker HyperPod clústeres.
Registro de SageMaker HyperPod eventos
Todos los eventos y registros de SageMaker HyperPod se guardan en Amazon CloudWatch con el nombre del grupo de registros/aws/sagemaker/Clusters/[ClusterName]/[ClusterID]
. Cada llamada a la CreateCluster
API crea un nuevo grupo de registros. La siguiente lista contiene todos los flujos de registro disponibles recopilados en cada grupo de registros.
Nombre del grupo de registros | Nombre del flujo de registro |
/aws/sagemaker/Clusters/[ClusterName]/[ClusterID] |
LifecycleConfig/[instance-group-name]/[instance-id] |
Registro SageMaker HyperPod a nivel de instancia
Puede acceder a los LifecycleScript registros publicados CloudWatch durante la configuración de la instancia del clúster. Cada instancia del clúster creado genera un flujo de registro independiente, que se distingue por el LifecycleConfig/[instance-group-name]/[instance-id]
formato.
Todos los registros en los que se escriben /var/log/provision/provisioning.log
se cargan en la CloudWatch secuencia anterior. Ejemplo LifecycleScripts de cómo 1.architectures/5.sagemaker_hyperpods/LifecycleScripts/base-config
stdout
y stderr
a esta ubicación. Si está utilizando sus scripts personalizados, escriba sus registros en la /var/log/provision/provisioning.log
ubicación en la que estén disponibles CloudWatch.
Etiquetado de recursos
AWS El sistema de etiquetado ayuda a administrar, identificar, organizar, buscar y filtrar los recursos. SageMaker HyperPod admite el etiquetado, por lo que puede administrar los clústeres como un AWS recurso. Durante la creación o edición de un clúster existente, puede añadir o editar etiquetas para el clúster. Para obtener más información sobre el etiquetado en general, consulta Cómo etiquetar tus AWS recursos.
Uso de la interfaz de usuario de la consola SageMaker HyperPod
Al crear un clúster nuevo y editarlo, puede añadir, eliminar o editar etiquetas.
Uso de las SageMaker HyperPod API
Cuando escribas un archivo de solicitud de UpdateClusterAPI CreateClustero un archivo de solicitud de API en formato JSON, edita la Tags
sección.
Usa los comandos AWS CLI de etiquetado para SageMaker
Para etiquetar un clúster
aws sagemaker add-tags
Utilícelo de la siguiente manera.
aws sagemaker add-tags --resource-arn
cluster_ARN
--tags Key=string
,Value=string
Para quitar la etiqueta de un clúster
Utilícelo de aws sagemaker delete-tags
la siguiente manera.
aws sagemaker delete-tags --resource-arn
cluster_ARN
--tag-keys"tag_key"
Para enumerar las etiquetas de un recurso
Use aws sagemaker list-tags
lo siguiente.
aws sagemaker list-tags --resource-arn
cluster_ARN