Controlli sanitari di base - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Controlli sanitari di base

SageMaker HyperPod esegue una serie di controlli di integrità di base sulle istanze del cluster durante la creazione e l'aggiornamento dei cluster. HyperPod Questi controlli di integrità di base sono indipendenti dall'orchestratore, quindi sono applicabili indipendentemente dalle piattaforme di orchestrazione sottostanti supportate da (Amazon o Slurm). SageMaker HyperPod EKS

I controlli di integrità di base monitorano le istanze del cluster per individuare problemi relativi a dispositivi come acceleratori (GPUe core Trainium) e dispositivi di rete (Elastic Fabric Adapter o). EFA Per trovare l'elenco dei controlli di base dello stato del cluster, consulta Controlli dello stato del cluster.