Exécution de tâches sur SageMaker HyperPod des clusters orchestrés par Amazon EKS - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Exécution de tâches sur SageMaker HyperPod des clusters orchestrés par Amazon EKS

Les rubriques suivantes fournissent des procédures et des exemples d'accès aux nœuds de calcul et d'exécution de charges de travail ML sur des SageMaker HyperPod clusters provisionnés orchestrés avec Amazon. EKS Selon la façon dont vous avez configuré l'environnement sur votre HyperPod cluster, il existe de nombreuses manières d'exécuter des charges de travail ML sur des HyperPod clusters.

Astuce

Pour une expérience pratique et des conseils sur la façon de configurer et d'utiliser un SageMaker HyperPod cluster orchestré avec AmazonEKS, nous vous recommandons de suivre cet SageMaker HyperPod atelier Amazon EKS Support in.

Les utilisateurs de data scientists peuvent entraîner des modèles fondamentaux en utilisant le EKS cluster défini comme orchestrateur du SageMaker HyperPod cluster. Les scientifiques exploitent les kubectl commandes natives SageMaker HyperPod CLIet les commandes natives pour trouver les SageMaker HyperPod clusters disponibles, soumettre des tâches de formation (Pods) et gérer leurs charges de travail. SageMaker HyperPod CLIPermet de soumettre des tâches à l'aide d'un fichier de schéma de tâches de formation et fournit des fonctionnalités de liste, de description, d'annulation et d'exécution des tâches. Les scientifiques peuvent utiliser Kubeflow Training Operator, Kueue (outil K8s pour la mise en file d'attente des tâches) et SageMaker-managed MLflow pour gérer les expériences de machine learning et les cycles de formation.