Verificações básicas de saúde - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Verificações básicas de saúde

SageMaker HyperPod executa um conjunto de verificações básicas de integridade em instâncias de cluster durante a criação e atualização de HyperPod clusters. Essas verificações básicas de saúde são independentes do orquestrador, portanto, essas verificações são aplicáveis independentemente das plataformas de orquestração subjacentes suportadas pela SageMaker HyperPod (Amazon ou Slurm). EKS

As verificações básicas de integridade monitoram as instâncias do cluster em busca de problemas relacionados a dispositivos como aceleradores (GPUe núcleos Trainium) e dispositivos de rede (Elastic Fabric Adapter ouEFA). Para encontrar a lista de verificações básicas de integridade do cluster, consulte Verificações de integridade do cluster.