Verificações de integridade básica - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Verificações de integridade básica

SageMaker HyperPod executa um conjunto de verificações básicas de integridade em instâncias de cluster durante a criação e atualização de HyperPod clusters. Essas verificações básicas de saúde são independentes do orquestrador, portanto, essas verificações são aplicáveis independentemente das plataformas de orquestração subjacentes suportadas pelo SageMaker HyperPod (Amazon EKS ou Slurm).

As verificações básicas de integridade monitoram as instâncias do cluster em busca de problemas relacionados a dispositivos como aceleradores (núcleos de GPU e Trainium) e dispositivos de rede (Elastic Fabric Adapter ou EFA). Para encontrar a lista de verificações básicas de integridade do cluster, consulte Verificações de integridade do cluster.