Requisitos previos para la observabilidad de los SageMaker HyperPod conglomerados - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Requisitos previos para la observabilidad de los SageMaker HyperPod conglomerados

Antes de continuar con los pasos necesariosInstale paquetes de exportación de métricas en su clúster HyperPod , asegúrese de que se cumplan los siguientes requisitos previos.

Habilite IAM Identity Center

Para habilitar la observabilidad de su SageMaker HyperPod clúster, primero debe habilitar IAM Identity Center. Este es un requisito previo para implementar un AWS CloudFormation pila que configura el espacio de trabajo de Grafana gestionado por Amazon y el Servicio gestionado por Amazon para Prometheus. Ambos servicios también requieren el Centro de IAM Identidad para la autenticación y la autorización, lo que garantiza el acceso seguro de los usuarios y la administración de la infraestructura de monitoreo.

Para obtener una guía detallada sobre cómo habilitar IAM Identity Center, consulte la sección Habilitación del IAM Identity Center en AWS IAMGuía del usuario de Identity Center.

Tras habilitar IAM Identity Center correctamente, configure una cuenta de usuario que sirva como usuario administrativo durante los siguientes procedimientos de configuración.

Cree e implemente un AWS CloudFormation apilar para la SageMaker HyperPod observabilidad

Cree e implemente una CloudFormation pila de SageMaker HyperPod observabilidad para monitorear las métricas de los HyperPod clústeres en tiempo real con Amazon Managed Service for Prometheus y Amazon Managed Grafana. Para implementar la pila, ten en cuenta que también debes habilitar tu IAM Centro de Identidad de antemano.

Utilice el CloudFormation script de muestra cluster-observability.yamlque le ayuda a configurar las VPC subredes de Amazon, los sistemas de archivos Amazon FSx for Lustre, los buckets de Amazon S3 y las IAM funciones necesarias para crear una pila de observabilidad de HyperPod clústeres.