Complete los requisitos previos para la observabilidad de los SageMaker HyperPod conglomerados - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Complete los requisitos previos para la observabilidad de los SageMaker HyperPod conglomerados

Antes de continuar con los pasos necesariosInstale paquetes de exportación de métricas en su clúster HyperPod , asegúrese de que se cumplen los siguientes requisitos previos.

Habilite IAM Identity Center

Para habilitar la observabilidad de su SageMaker HyperPod clúster, primero debe habilitar IAM Identity Center. Este es un requisito previo para implementar una AWS CloudFormation pila que configure el espacio de trabajo de Grafana gestionado por Amazon y el Servicio gestionado de Amazon para Prometheus. Ambos servicios también requieren el Centro de IAM Identidad para la autenticación y la autorización, lo que garantiza el acceso seguro de los usuarios y la administración de la infraestructura de monitoreo.

Para obtener instrucciones detalladas sobre cómo habilitar IAM Identity Center, consulte la sección Habilitar IAM Identity Center en la Guía del usuario de AWS IAM Identity Center.

Tras habilitar IAM Identity Center correctamente, configure una cuenta de usuario que servirá como usuario administrativo durante los siguientes procedimientos de configuración.

Cree e implemente una AWS CloudFormation pila para garantizar la observabilidad SageMaker HyperPod

Cree e implemente una CloudFormation pila de SageMaker HyperPod observabilidad para monitorear las métricas de los HyperPod clústeres en tiempo real con Amazon Managed Service for Prometheus y Amazon Managed Grafana. Para implementar la pila, ten en cuenta que también debes habilitar tu IAM centro de identidad de antemano.

Utilice el CloudFormation script de muestra cluster-observability.yamlque le ayuda a configurar las VPC subredes de Amazon, los sistemas de archivos Amazon FSx for Lustre, los buckets de Amazon S3 y las IAM funciones necesarias para crear una pila de observabilidad de HyperPod clústeres.