Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Exécution de tâches sur SageMaker HyperPod des clusters orchestrés par Amazon EKS
Les rubriques suivantes fournissent des procédures et des exemples d'accès aux nœuds de calcul et d'exécution de charges de travail ML sur des SageMaker HyperPod clusters provisionnés orchestrés avec Amazon EKS. Selon la façon dont vous avez configuré l'environnement sur votre HyperPod cluster, il existe de nombreuses manières d'exécuter des charges de travail ML sur des HyperPod clusters.
Astuce
Pour une expérience pratique et des conseils sur la façon de configurer et d'utiliser un SageMaker HyperPod cluster orchestré avec Amazon EKS, nous vous recommandons de suivre cet SageMaker HyperPod atelier de support Amazon EKS
Les utilisateurs de data scientists peuvent entraîner des modèles fondamentaux en utilisant le cluster EKS défini comme orchestrateur du SageMaker HyperPod cluster. Les scientifiques utilisent la SageMaker HyperPod CLIkubectl
commandes natives pour trouver les SageMaker HyperPod clusters disponibles, soumettre des tâches de formation (Pods) et gérer leurs charges de travail. La SageMaker HyperPod CLI permet de soumettre des tâches à l'aide d'un fichier de schéma de tâches de formation et fournit des fonctionnalités de liste, de description, d'annulation et d'exécution des tâches. Les scientifiques peuvent utiliser Kubeflow Training Operator