Controles de salud básicos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Controles de salud básicos

SageMaker HyperPod realiza un conjunto de comprobaciones de estado básicas en las instancias del clúster durante la creación y actualización de HyperPod los clústeres. Estas comprobaciones de estado básicas son independientes del orquestador, por lo que son aplicables independientemente de las plataformas de orquestación subyacentes compatibles ( SageMaker HyperPod Amazon o Slurm). EKS

Las comprobaciones de estado básicas supervisan las instancias del clúster para detectar problemas relacionados con dispositivos como los aceleradores (GPUy los núcleos Trainium) y los dispositivos de red (Elastic Fabric Adapter o Elastic Fabric Adapter). EFA Para ver la lista de comprobaciones de estado básicas de los clústeres, consulte Comprobaciones de estado de los clústeres.