Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
SageMaker HyperPod références
Vous trouverez plus d'informations et de références sur l'utilisation SageMaker HyperPod dans les rubriques suivantes.
Rubriques
SageMaker HyperPod tarification
Les rubriques suivantes fournissent des informations sur la SageMaker HyperPod tarification. Pour en savoir plus sur le prix horaire d'utilisation des SageMaker HyperPod instances, consultez également Amazon SageMaker AI Pricing
Demandes de capacité
Vous pouvez allouer des capacités de calcul à la demande ou réservées avec SageMaker l'IA pour une utilisation sur SageMaker HyperPod. La création de clusters à la demande alloue la capacité disponible à partir du pool de capacités à la demande de l' SageMaker IA. Vous pouvez également demander une capacité réservée pour garantir l'accès en soumettant un ticket pour une augmentation du quota. Les demandes de capacité entrantes sont hiérarchisées par l' SageMaker IA et vous recevez une estimation du temps nécessaire à l'allocation de capacité.
Facturation des services
Lorsque vous allouez une capacité de calcul sur SageMaker HyperPod, vous êtes facturé pour la durée de l'allocation de capacité. SageMaker HyperPod la facturation apparaît sur vos factures d'anniversaire avec un poste correspondant au type d'allocation de capacité (à la demande, réservée), au type d'instance et au temps passé à utiliser l'instance.
Pour soumettre un ticket pour une augmentation de quota, voirSageMaker HyperPod quotas.
SageMaker HyperPod APIs
La liste suivante est un ensemble complet de SageMaker HyperPod APIs demandes d'action au JSON format SageMaker AI via AWS CLI ou AWS SDK for Python (Boto3).
SageMaker HyperPod formulaires
Pour configurer l'outil de gestion de charge de travail Slurm HyperPod, vous devez créer le fichier de configuration Slurm requis à HyperPod l'aide du formulaire fourni.
Formulaire de configuration pour le provisionnement des nœuds Slurm sur HyperPod
Le code suivant est le formulaire de configuration de Slurm que vous devez préparer pour configurer correctement les nœuds Slurm sur votre cluster. HyperPod Vous devez remplir ce formulaire et le télécharger dans le cadre d'un ensemble de scripts de cycle de vie lors de la création du cluster. Pour savoir comment ce formulaire doit être préparé tout au long des processus de création de HyperPod clusters, voirPersonnalisez les SageMaker HyperPod clusters à l'aide de scripts de cycle.
// Save as provisioning_params.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "
string
", "login_group": "string
", "worker_groups": [ { "instance_group_name": "string
", "partition_name": "string
" } ], "fsx_dns_name": "string
", "fsx_mountname": "string
" }
-
version
: obligatoire. Il s'agit de la version du formulaire des paramètres HyperPod d'approvisionnement. Gardez-le comme ça1.0.0
. -
workload_manager
: obligatoire. Cela permet de spécifier le gestionnaire de charge de travail à configurer sur le HyperPod cluster. Gardez-le comme çaslurm
. -
controller_group
: obligatoire. Cela permet de spécifier le nom du groupe d'instances de HyperPod cluster que vous souhaitez attribuer au nœud du contrôleur (tête) Slurm. -
login_group
: facultatif. Cela permet de spécifier le nom du groupe d'instances de HyperPod cluster que vous souhaitez attribuer au nœud de connexion Slurm. -
worker_groups
: obligatoire. Cela permet de configurer les nœuds de travail (de calcul) Slurm sur le HyperPod cluster.-
instance_group_name
: obligatoire. Cela permet de spécifier le nom du groupe d' HyperPod instances que vous souhaitez attribuer au nœud de travail (de calcul) de Slurm. -
partition_name
: obligatoire. Cela permet de spécifier le nom de partition du nœud.
-
-
fsx_dns_name
: facultatif. Si vous souhaitez configurer vos nœuds Slurm sur le HyperPod cluster pour communiquer avec AmazonFSx, spécifiez le FSx DNS nom. -
fsx_mountname
: facultatif. Si vous souhaitez configurer vos nœuds Slurm sur le HyperPod cluster pour communiquer avec AmazonFSx, spécifiez le nom du FSx montage.
SageMaker HyperPod DLAMI
SageMaker HyperPod exécute une DLAMI base basée sur :
-
AWS Deep Learning Base GPU AMI (Ubuntu 20.04)
pour l'orchestration avec Slurm. -
Basé sur Amazon Linux 2 AMI pour l'orchestration avec AmazonEKS.
SageMaker HyperPod DLAMIIl est fourni avec des packages supplémentaires pour prendre en charge les outils open source tels que Slurm, Kubernetes, les dépendances, et des packages logiciels de cluster pour prendre en charge les fonctionnalités de résilience telles que le contrôle de l'état du SageMaker HyperPod cluster et la reprise automatique. Pour suivre les mises à jour HyperPod logicielles distribuées par l'équipe de HyperPod serviceDLAMIs, voirNotes de SageMaker HyperPod publication d'Amazon.
Référence des autorisations SageMaker HyperPod API
Important
Les IAM politiques personnalisées qui autorisent Amazon SageMaker Studio ou Amazon SageMaker Studio Classic à créer des SageMaker ressources Amazon doivent également accorder des autorisations pour ajouter des balises à ces ressources. L'autorisation d'ajouter des balises aux ressources est requise car Studio et Studio Classic balisent automatiquement toutes les ressources qu'ils créent. Si une IAM politique autorise Studio et Studio Classic à créer des ressources mais n'autorise pas le balisage, des erreurs « AccessDenied » peuvent se produire lors de la tentative de création de ressources. Pour de plus amples informations, veuillez consulter Fournir des autorisations pour le balisage des ressources d' SageMaker IA.
AWS politiques gérées pour Amazon SageMaker AIqui donnent des autorisations pour créer des SageMaker ressources incluent déjà des autorisations pour ajouter des balises lors de la création de ces ressources.
Lorsque vous configurez le contrôle d'accès pour autoriser l'exécution d' SageMaker HyperPod APIopérations et que vous rédigez une politique d'autorisations que vous pouvez associer aux IAM utilisateurs pour les administrateurs du cloud, utilisez le tableau suivant comme référence.
SageMaker APIOpérations Amazon | Autorisations requises (APIactions) | Ressources |
CreateCluster | sagemaker:CreateCluster |
arn:aws:sagemaker: |
DeleteCluster | sagemaker:DeleteCluster |
arn:aws:sagemaker: |
DescribeCluster | sagemaker:DescribeCluster |
arn:aws:sagemaker: |
DescribeClusterNode | sagemaker:DescribeClusterNode |
arn:aws:sagemaker: |
ListClusterNodes | sagemaker:ListClusterNodes |
arn:aws:sagemaker: |
ListClusters | sagemaker:ListClusters |
arn:aws:sagemaker: |
UpdateCluster | sagemaker:UpdateCluster |
arn:aws:sagemaker: |
UpdateClusterSoftware | sagemaker:UpdateClusterSoftware |
arn:aws:sagemaker: |
Pour obtenir la liste complète des autorisations et des types de ressources pour SageMaker APIs, consultez la section Actions, ressources et clés de condition pour Amazon SageMaker AI dans le AWS Service Authorization Reference.
SageMaker HyperPod commandes dans AWS CLI
Les AWS CLI commandes suivantes permettent SageMaker HyperPod d'exécuter les HyperPod APIopérations principales.
SageMaker HyperPod Modules Python dans AWS SDK for Python (Boto3)
Voici les méthodes utilisées par le AWS SDK for Python (Boto3) client pour que l' SageMaker IA exécute les HyperPod APIopérations de base.