

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Démarrage SageMaker HyperPod rapide d'Amazon
<a name="sagemaker-hyperpod-quickstart"></a>

Ce guide de démarrage rapide vous explique comment créer votre premier HyperPod cluster avec les orchestrations Slurm et Amazon EKS (EKS). Choisissez l'orchestration qui répond le mieux aux besoins de votre infrastructure pour commencer SageMaker HyperPod.

**Topics**
+ [Création d'un cluster orchestré par Slurm SageMaker HyperPod](#sagemaker-hyperpod-quickstart-slurm)
+ [Création d'un cluster orchestré par EKS SageMaker HyperPod](#sagemaker-hyperpod-quickstart-eks)
+ [Soumission des charges de travail](#sagemaker-hyperpod-quickstart-workload)

## Création d'un cluster orchestré par Slurm SageMaker HyperPod
<a name="sagemaker-hyperpod-quickstart-slurm"></a>

Suivez ces étapes pour créer votre premier SageMaker HyperPod cluster avec l'orchestration Slurm.

1. Ouvrez la console Amazon SageMaker AI à l'adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Choisissez **HyperPod Clusters** dans le volet de navigation de gauche, puis **Gestion des clusters**.

1. Sur la page **SageMaker HyperPod Clusters**, choisissez **Create HyperPod cluster**. 

1. Dans le menu déroulant **Créer un HyperPod cluster**, choisissez **Orchestrated by Slurm**.

1. Sur la page de création du cluster, choisissez **Configuration rapide**. Cette option vous permet de démarrer immédiatement avec les paramètres par défaut. SageMaker L'IA créera de nouvelles ressources telles que le VPC, les sous-réseaux, les groupes de sécurité, le compartiment Amazon S3, le rôle IAM et FSx pour Lustre lors de la création de votre cluster.

1. Dans **Paramètres généraux**, spécifiez un nom pour le nouveau cluster. Vous ne pourrez pas modifier le nom après la création du cluster.

1. Dans **Groupes d’instances**, choisissez **Ajouter un groupe**. Chaque groupe d’instances peut être configuré différemment et vous pouvez créer un cluster hétérogène composé de plusieurs groupes d’instances avec divers types d’instances. Pour déployer un cluster, vous devez ajouter au moins un groupe d’instances. Vous pouvez ajouter un seul groupe d’instances à la fois. Pour créer plusieurs groupes d’instances, répétez le processus pour chaque groupe d’instances.

   Procédez comme suit pour ajouter un groupe d’instances.

   1. Pour **Type de groupe d’instances**, choisissez un type pour votre groupe d’instances. Pour ce démarrage rapide, choisissez **Contrôleur (principal)** pour `my-controller-group`, **Connexion** pour `my-login-group` et **Calcul (travail)** pour `worker-group-1`. 

   1. Pour **Nom**, spécifiez le nom du groupe d’instances. Pour ce démarrage rapide, créez trois groupes d’instances nommés `my-controller-group`, `my-login-group` et `worker-group-1`.

   1.  Pour **Capacité de l’instance**, choisissez une capacité à la demande ou un plan d’entraînement pour réserver vos ressources de calcul.

   1. Pour **Type d’instance**, choisissez l’instance pour le groupe d’instances. Pour ce démarrage rapide, sélectionnez `ml.c5.xlarge` pour `my-controller-group`, `ml.m5.4xlarge` pour `my-login-group` et `ml.trn1.32xlarge` pour `worker-group-1`. 

      Assurez-vous de choisir le type d’instance avec des quotas suffisants dans votre compte, ou demandez des quotas supplémentaires en suivant les instructions fournies dans [SageMaker HyperPod quotas](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-quotas).

   1. Pour **Quantité d’instances**, spécifiez un entier ne dépassant pas le quota d’instances pour l’utilisation du cluster. Pour ce démarrage rapide, entrez **1** pour les trois groupes.

   1. Pour **Zone de disponibilité cible**, choisissez la zone de disponibilité dans laquelle vos instances seront provisionnées. La zone de disponibilité doit correspondre à l’emplacement de votre capacité de calcul accélérée.

   1. Pour **Autre volume de stockage par instance (Go) – facultatif**, spécifiez un entier compris entre 1 et 16 384 pour définir la taille d’un volume Elastic Block Store (EBS) supplémentaire en gigaoctets (Go). Le volume EBS est attaché à chaque instance du groupe d’instances. Le chemin de montage par défaut pour le volume EBS supplémentaire est `/opt/sagemaker`. Une fois le cluster créé avec succès, vous pouvez accéder par SSH aux instances du cluster (nœuds) et vérifier si le volume EBS est correctement monté en exécutant la commande `df -h`. L’attachement d’un volume EBS supplémentaire fournit un stockage stable, hors instance et persistant de manière indépendante, comme décrit dans la section [Volumes Amazon EBS](https://docs.aws.amazon.com//ebs/latest/userguide/ebs-volumes.html) du *Guide de l’utilisateur Amazon Elastic Block Store*.

   1. Choisissez **Ajouter un groupe d’instances**.

1.  Dans **Paramètres de configuration rapide par défaut**, passez en revue les paramètres par défaut. Cette section répertorie tous les paramètres par défaut pour la création de votre cluster, y compris toutes les nouvelles AWS ressources qui seront créées au cours du processus de création du cluster.

1. Sélectionnez **Soumettre**.

Pour de plus amples informations, veuillez consulter [Commencer à SageMaker HyperPod utiliser la console SageMaker AI](smcluster-getting-started-slurm-console.md).

## Création d'un cluster orchestré par EKS SageMaker HyperPod
<a name="sagemaker-hyperpod-quickstart-eks"></a>

Suivez ces étapes pour créer votre premier SageMaker HyperPod cluster avec l'orchestration Amazon EKS.

1. Ouvrez la console Amazon SageMaker AI à l'adresse [https://console.aws.amazon.com/sagemaker/](https://console.aws.amazon.com/sagemaker/).

1. Choisissez **HyperPod Clusters** dans le volet de navigation de gauche, puis **Gestion des clusters**.

1. Sur la page **SageMaker HyperPod Clusters**, choisissez **Create HyperPod cluster**. 

1. Dans le menu déroulant **Créer un HyperPod cluster**, sélectionnez **Orchestrated by Amazon EKS**.

1. Sur la page de création du cluster, choisissez **Configuration rapide**. Avec cette option, vous pouvez commencer immédiatement avec les paramètres par défaut. SageMaker L'IA créera de nouvelles ressources telles que le VPC, les sous-réseaux, les groupes de sécurité, le compartiment Amazon S3, le rôle IAM et FSx pour Lustre lors de la création de votre cluster.

1. Dans **Paramètres généraux**, spécifiez un nom pour le nouveau cluster. Vous ne pourrez pas modifier le nom après la création du cluster. 

1. Dans **Groupes d’instances**, choisissez **Ajouter un groupe**. Chaque groupe d’instances peut être configuré différemment et vous pouvez créer un cluster hétérogène composé de plusieurs groupes d’instances avec divers types d’instances. Pour déployer un cluster, vous devez ajouter au moins un groupe d’instances. Vous pouvez ajouter un seul groupe d’instances à la fois. Pour créer plusieurs groupes d’instances, répétez le processus pour chaque groupe d’instances.

   Procédez comme suit pour ajouter un groupe d’instances.

   1. Pour **Type de groupe d’instances**, choisissez **Standard** ou **Groupe d’instances restreint (RIG)**. Généralement, vous choisissez **Standard**, qui fournit un environnement informatique à usage général sans restrictions de sécurité supplémentaires. **Groupe d’instances restreint (RIG)** est un environnement spécialisé pour la personnalisation de modèles de fondation tels qu’Amazon Nova. Pour plus d'informations sur la configuration de RIG pour la personnalisation des modèles Amazon Nova, consultez la section Personnalisation d'Amazon Nova SageMaker HyperPod dans le guide de l'[utilisateur d'Amazon Nova 1.0 ou dans le guide](https://docs.aws.amazon.com//nova/latest/userguide/nova-hp.html) de l'[utilisateur d'Amazon Nova 2.0](https://docs.aws.amazon.com//nova/latest/nova2-userguide/nova-hp.html).

   1. Pour **Nom**, spécifiez le nom du groupe d’instances.

   1.  Pour **Capacité de l’instance**, choisissez une capacité à la demande ou un plan d’entraînement pour réserver vos ressources de calcul.

   1. Pour **Type d’instance**, choisissez l’instance pour le groupe d’instances. Assurez-vous de choisir le type d’instance avec des quotas suffisants dans votre compte, ou demandez des quotas supplémentaires en suivant les instructions fournies dans [SageMaker HyperPod quotas](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-quotas).

   1. Pour **Quantité d’instances**, spécifiez un entier ne dépassant pas le quota d’instances pour l’utilisation du cluster. Pour ce démarrage rapide, entrez **1** pour les trois groupes.

   1. Pour **Zone de disponibilité cible**, choisissez la zone de disponibilité dans laquelle vos instances seront provisionnées. La zone de disponibilité doit correspondre à l’emplacement de votre capacité de calcul accélérée.

   1. Pour **Autre volume de stockage par instance (Go) – facultatif**, spécifiez un entier compris entre 1 et 16 384 pour définir la taille d’un volume Elastic Block Store (EBS) supplémentaire en gigaoctets (Go). Le volume EBS est attaché à chaque instance du groupe d’instances. Le chemin de montage par défaut pour le volume EBS supplémentaire est `/opt/sagemaker`. Une fois le cluster créé avec succès, vous pouvez accéder par SSH aux instances du cluster (nœuds) et vérifier si le volume EBS est correctement monté en exécutant la commande `df -h`. L’attachement d’un volume EBS supplémentaire fournit un stockage stable, hors instance et persistant de manière indépendante, comme décrit dans la section [Volumes Amazon EBS](https://docs.aws.amazon.com//ebs/latest/userguide/ebs-volumes.html) du *Guide de l’utilisateur Amazon Elastic Block Store*.

   1. Pour **Vérifications de surveillance approfondie de l’état des instances**, choisissez votre option. Des vérifications de surveillance approfondie de l’état surveillent l’état des instances lors de leur création et après les mises à jour logicielles. Elles permettent de récupérer automatiquement les instances défectueuses par le biais de redémarrages ou de remplacements lorsqu’elles sont activées.

   1. Choisissez **Ajouter un groupe d’instances**.

1.  Dans **Paramètres de configuration rapide par défaut**, passez en revue les paramètres par défaut. Cette section répertorie tous les paramètres par défaut pour la création de votre cluster, y compris toutes les nouvelles AWS ressources qui seront créées au cours du processus de création du cluster.

1. Sélectionnez **Soumettre**.

Pour de plus amples informations, veuillez consulter [Création d'un SageMaker HyperPod cluster avec l'orchestration Amazon EKS](sagemaker-hyperpod-eks-operate-console-ui-create-cluster.md).

## Soumission des charges de travail
<a name="sagemaker-hyperpod-quickstart-workload"></a>

Suivez les didacticiels de ces ateliers pour soumettre des exemples de charges de travail.
+ [Amazon SageMaker HyperPod pour Slurm](https://catalog.workshops.aws/sagemaker-hyperpod/en-US)
+ [Amazon SageMaker HyperPod pour Amazon EKS](https://catalog.workshops.aws/sagemaker-hyperpod-eks/en-US)