Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Esegui un lavoro di formazione su k8s HyperPod
SageMaker HyperPod Recipes supporta l'invio di un lavoro di formazione a un cluster GPU /Trainium Kubernetes. Prima di inviare il lavoro di formazione, esegui una delle seguenti operazioni:
-
Modificare il file di configurazione del
k8s.yaml
cluster -
Sovrascrivi la configurazione del cluster tramite la riga di comando
Dopo aver eseguito uno dei passaggi precedenti, installa l'ambiente corrispondente.
Configura il cluster utilizzando k8s.yaml
Per inviare un lavoro di formazione a un cluster Kubernetes, devi specificare configurazioni specifiche di Kubernetes. Le configurazioni includono lo spazio dei nomi del cluster o la posizione del volume persistente.
pullPolicy: Always restartPolicy: Never namespace: default persistent_volume_claims: - null
-
pullPolicy
: È possibile specificare la policy pull quando si invia un lavoro di formazione. Se specifichi «Sempre», il cluster Kubernetes estrae sempre l'immagine dal repository. Per ulteriori informazioni, consulta Image pull policy. -
restartPolicy
: Specificate se riavviare il processo di formazione in caso di esito negativo. -
namespace
: Puoi specificare lo spazio dei nomi Kubernetes a cui inviare il processo di formazione. -
persistent_volume_claims
: Puoi specificare un volume condiviso per il tuo processo di formazione per consentire a tutti i processi di formazione di accedere ai file del volume.