Commencez avec EFA et MPI pour les HPC charges de travail sur Amazon EC2 - Amazon Elastic Compute Cloud

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Commencez avec EFA et MPI pour les HPC charges de travail sur Amazon EC2

Ce didacticiel vous permet de lancer un cluster d'instances EFA et MPI activé pour les charges HPC de travail.

Étape 1 : Préparer un groupe de sécurité EFA activé pour les

Un a a a EFA besoin d'un groupe de sécurité qui autorise tout le trafic entrant et sortant vers et depuis le groupe de sécurité proprement dit. La procédure suivante crée un groupe de sécurité qui autorise tout le trafic entrant et sortant vers et depuis lui-même, et qui autorise le SSH trafic entrant depuis n'importe quelle IPv4 adresse à des fins de connectivité. SSH

Important

Ce groupe de sécurité n’est destiné qu’à des fins de test. Pour vos environnements de production, nous vous recommandons de créer une SSH règle entrante qui autorise le trafic uniquement à partir de l'adresse IP à partir de laquelle vous vous connectez, telle que l'adresse IP de votre ordinateur ou une plage d'adresses IP de votre réseau local.

Pour d’autres scénarios, consultez Règles de groupe de sécurité pour différents cas d’utilisation.

Pour créer un groupe de sécurité EFA activé pour les
  1. Ouvrez la EC2 console Amazon à l'adresse https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation, choisissez Security Groups (Groupes de sécurité), puis Create security group (Créer un groupe de sécurité).

  3. Dans la fenêtre Create security group (Créer un groupe de sécurité), procédez comme suit :

    1. Pour Nom du groupe de sécurité, saisissez un nom descriptif pour le groupe de sécurité, tel que EFA-enabled security group.

    2. (Facultatif) Pour Description, saisissez une brève description du groupe de sécurité.

    3. Pour VPC, sélectionnez l'instance VPC dans laquelle vous souhaitez lancer vos instances EFA activées.

    4. Sélectionnez Create security group (Créer un groupe de sécurité).

  4. Sélectionnez le groupe de sécurité que vous avez créé et dans l’onglet Details (Détails), copiez le Security group ID (ID du groupe de sécurité).

  5. En conservant la sélection du groupe de sécurité, choisissez Actions, Edit inbound rules (Modifier les règles entrantes), puis procédez comme suit :

    1. Choisissez Ajouter une règle.

    2. Pour Type, sélectionnez Tout le trafic.

    3. Pour Source type (Type de source), choisissez Custom (Personnalisée) et collez l’ID du groupe de sécurité que vous avez copié dans le champ.

    4. Choisissez Ajouter une règle.

    5. Pour Type, sélectionnez SSH.

    6. Pour Type de source, choisissez Anywhere- IPv4.

    7. Sélectionnez Enregistrer les règles.

  6. En conservant la sélection du groupe de sécurité, choisissez Actions, Edit outbound rules (Modifier les règles sortantes), puis procédez comme suit :

    1. Choisissez Ajouter une règle.

    2. Pour Type, sélectionnez Tout le trafic.

    3. Pour Destination type (Type de destination), choisissez Custom (Personnalisée) et collez l’ID du groupe de sécurité que vous avez copié dans le champ.

    4. Sélectionnez Enregistrer les règles.

Étape 2 : Lancer une instance temporaire

Lancez une instance temporaire que vous pouvez utiliser pour installer et configurer les composants EFA logiciels. Vous utilisez cette instance pour créer une EFA activée AMI pour. Vous pouvez lancer vos instances EFA activées pour.

Pour lancer une instance temporaire
  1. Ouvrez la EC2 console Amazon à l'adresse https://console.aws.amazon.com/ec2/.

  2. Dans le volet de navigation, choisissez Instances, puis Launch Instances (Lancer des instances) pour ouvrir le nouvel assistant de lancement d’instance.

  3. (Facultatif) Dans la section Name and tags (Noms et identifications), fournissez un nom pour l’instance, tel que EFA-instance. Le nom est attribué à l’instance en tant qu’identification de ressource (Name=EFA-instance).

  4. Dans la section Images de l'application et du système d'exploitation, sélectionnez un AMI pour l'un des systèmes d'exploitation pris en charge.

  5. Dans la section Instance type (Type d’instance), sélectionnez un type d’instance pris en charge.

  6. Dans la section Key pair (Paire de clés), sélectionnez la paire de clés à utiliser pour l’instance.

  7. Dans la section Network settings (Paramètres réseau), choisissez Edit (Modifier), puis procédez comme suit :

    1. Pour Sous-réseau, choisissez le sous-réseau dans lequel lancer l’instance. Si vous ne sélectionnez pas de sous-réseau, vous ne pouvez pas activer l'instance pourEFA.

    2. Pour Firewall (security groups) (Pare-feu (groupes de sécurité)), choisissez Sélectionner un groupe de sécurité existant (Select existing security group), puis sélectionnez le groupe de sécurité que vous avez créé à l’étape précédente.

    3. Développez la section Configuration réseau avancée.

      Pour l'interface réseau 1, sélectionnez Index de la carte réseau = 0, Index du périphérique = 0 et Type d'interface = EFA avec ENA.

      (Facultatif) Si vous utilisez un type d'instance multicarte, tel que p4d.24xlarge oup5.48xlarge, pour chaque interface réseau supplémentaire requise, choisissez Ajouter une interface réseau, pour Index de carte réseau, sélectionnez le prochain index non utilisé, puis sélectionnez Index du périphérique = 1 et Type d'interface = EFA avec ENA ou EFA-only.

  8. Dans la section Storage (Stockage), configurez les volumes selon vos besoins.

  9. Dans le panneau Summary (Récapitulatif) à droite, choisissez Launch instance (Lancer l’instance).

Note

Envisagez d'exiger l'utilisation de IMDSv2 pour l'instance temporaire ainsi AMI que celle que vous allez créer à l'étape 9, sauf si vous l'avez déjà définie IMDSv2 comme instance par défaut pour le compte. Pour plus d'informations sur les étapes IMDSv2 de configuration, consultezConfigurer les options de métadonnées d’instance pour les nouvelles instances.

Étape 3 : Installer le logiciel EFA

Installez le noyau EFA activé pour, EFA les pilotes, Libfabric et Open MPI Stack requis pour prendre en charge votre EFA instance temporaire.

Les étapes varient selon que vous avez l'intention d'utiliser EFA avec OpenMPI, avec Intel MPI ou avec Open MPI et IntelMPI.

Pour installer le logiciel EFA
  1. Connectez-vous à l’instance que vous avez lancée. Pour de plus amples informations, veuillez consulter Connectez-vous à votre instance Linux à l'aide de SSH.

  2. Pour vous assurer que tous vos packages logiciels sont mis à jour, effectuez une mise à jour logicielle rapide sur votre instance. Ce processus peut prendre quelques minutes.

    • Amazon Linux 2023, Amazon Linux 2, RHEL 8/9, Rocky Linux 8/9

      $ sudo yum update -y
    • Ubuntu et Debian

      $ sudo apt-get update && sudo apt-get upgrade -y
    • SUSELinux Enterprise

      $ sudo zypper update -y
  3. Redémarrez l’instance et reconnectez-vous à celle-ci.

  4. Téléchargez les fichiers d'installation du logiciel EFA. Les fichiers d’installation du logiciel sont packagés dans un fichier d’archive compressé (.tar.gz). Pour télécharger la version stable la plus récente, utilisez la commande suivante.

    $ curl -O https://efa-installer.amazonaws.com/aws-efa-installer-1.37.0.tar.gz

    Vous pouvez aussi obtenir la dernière version en remplaçant le numéro de version par latest dans la commande ci-dessus.

  5. (Facultatif) Vérifiez l'authenticité et l'intégrité du fichier EFA tarball (.tar.gz).

    Nous vous recommandons de le faire pour vérifier l’identité de l’éditeur du logiciel et pour vérifier que le fichier n’a pas été modifié ou endommagé depuis sa publication. Si vous ne souhaitez pas vérifier le fichier d’archive, ignorez cette étape.

    Note

    Sinon, si vous préférez vérifier le fichier d'archive à l'aide d'un SHA256 total de contrôle MD5 ou à la place, consultez. Vérification du EFA programme d'installation à l'aide d'un total de contrôle

    1. Téléchargez la GPG clé publique et importez-la dans votre porte-clés.

      $ wget https://efa-installer.amazonaws.com/aws-efa-installer.key && gpg --import aws-efa-installer.key

      La commande doit renvoyer une valeur clé. Notez la valeur clé, car vous en aurez besoin lors de l’étape suivante.

    2. Vérifier l'empreinte digitale de la GPG clé. Exécutez la commande suivante et spécifiez la valeur clé que vous avez obtenue à l’étape précédente.

      $ gpg --fingerprint key_value

      La commande doit renvoyer une empreinte digitale identique à 4E90 91BC BB97 A96B 26B1 5E59 A054 80B1 DD2D 3CCC. Si l'empreinte digitale ne correspond pas, n'exécutez pas le script EFA d'installation et contactez AWS Support.

    3. Téléchargez le fichier SIGNATURE et vérifiez la signature du fichier d'EFAarchive.

      $ wget https://efa-installer.amazonaws.com/aws-efa-installer-1.37.0.tar.gz.sig && gpg --verify ./aws-efa-installer-1.37.0.tar.gz.sig

      Voici un exemple de sortie.

      gpg: Signature made Wed 29 Jul 2020 12:50:13 AM UTC using RSA key ID DD2D3CCC gpg: Good signature from "Amazon EC2 EFA <ec2-efa-maintainers@amazon.com>" gpg: WARNING: This key is not certified with a trusted signature! gpg: There is no indication that the signature belongs to the owner. Primary key fingerprint: 4E90 91BC BB97 A96B 26B1 5E59 A054 80B1 DD2D 3CCC

      Si le résultat inclut Good signature et que l’empreinte digitale correspond à l’empreinte digitale renvoyée à l’étape précédente, passez à l’étape suivante. Si ce n'est pas le cas, n'exécutez pas le script EFA d'installation et contactez AWS Support.

  6. Procédez à l’extraction des fichiers à partir du fichier compressé .tar.gz et accédez au répertoire extrait.

    $ tar -xf aws-efa-installer-1.37.0.tar.gz && cd aws-efa-installer
  7. Installez le logiciel EFA. Effectuez l’une des actions suivantes en fonction de votre cas d’utilisation.

    Note

    EFAn'est pas compatible NVIDIA GPUDirect avec SUSE Linux. Si vous utilisez SUSE Linux, vous devez également spécifier l'--skip-kmodoption pour empêcher l'installation de kmod. Par défaut, SUSE Linux n'autorise pas les modules out-of-tree du noyau.

    Open MPI and Intel MPI

    Si vous avez l'intention d'utiliser EFA avec Open MPI et IntelMPI, vous devez installer le EFA logiciel avec Libfabric et OpenMPI, et vous devez réaliser l'Étape 5 : Installer Intel MPI.

    Pour installer le EFA logiciel avec Libfabric et OpenMPI, exécutez la commande suivante.

    Note

    Depuis EFA 1.30.0, Open MPI 4 et Open MPI 5 sont installés par défaut. Vous pouvez éventuellement spécifier la version d'Open MPI que vous souhaitez installer. Pour installer uniquement Open MPI 4, incluez--mpi=openmpi4. Pour installer uniquement Open MPI 5, incluez--mpi=openmpi5. Pour installer les deux, omettez l’option --mpi.

    $ sudo ./efa_installer.sh -y

    Libfabric est installé dans /opt/amazon/efa. Open MPI 4 est installé sur/opt/amazon/openmpi. Open MPI 5 est installé sur/opt/amazon/openmpi5.

    Open MPI only

    Si vous avez l'intention d'utiliser EFA avec Open MPI uniquement, vous devez installer le EFA logiciel avec Libfabric et OpenMPI, et vous pouvez ignorer l'Étape 5 : Installer Intel MPI. Pour installer le EFA logiciel avec Libfabric et OpenMPI, exécutez la commande suivante.

    Note

    Depuis EFA 1.30.0, Open MPI 4 et Open MPI 5 sont installés par défaut. Vous pouvez éventuellement spécifier la version d'Open MPI que vous souhaitez installer. Pour installer uniquement Open MPI 4, incluez--mpi=openmpi4. Pour installer uniquement Open MPI 5, incluez--mpi=openmpi5. Pour installer les deux, omettez l’option --mpi.

    $ sudo ./efa_installer.sh -y

    Libfabric est installé dans /opt/amazon/efa. Open MPI 4 est installé sur/opt/amazon/openmpi. Open MPI 5 est installé sur/opt/amazon/openmpi5.

    Intel MPI only

    Si vous avez l'intention d'utiliser MPI uniquement EFA avec Intel, vous pouvez installer le EFA logiciel sans Libfabric ni OpenMPI. Dans ce cas, Intel MPI utilise son Libfabric intégré. Si vous optez pour cette solution, vous devez réaliser l'Étape 5 : Installer Intel MPI.

    Pour installer le EFA logiciel sans Libfabric ni OpenMPI, exécutez la commande suivante.

    $ sudo ./efa_installer.sh -y --minimal
  8. Si le EFA programme d'installation vous invite à redémarrer l'instance, faites-le et reconnectez-vous à l'instance. Sinon, déconnectez-vous de l’instance, puis reconnectez-vous pour terminer l’installation.

Étape 4 : (Facultatif) Activer Open MPI 5

Note

Vous ne devez effectuer cette étape que si vous avez l'intention d'utiliser MPI Intel 5.

Depuis EFA 1.30.0, Open MPI 4 et Open MPI 5 sont installés par défaut. Vous pouvez également choisir d'installer uniquement Open MPI 4 ou Open MPI 5.

Si vous avez choisi d'installer Open MPI 5 à l'Étape 3 : Installer le EFA logiciel et que vous avez l'intention de l'utiliser, vous devez effectuer les étapes suivantes pour l'activer.

Activation d'Open MPI 5
  1. Ajoutez Open MPI 5 à la variable d'PATHenvironnement.

    $ module load openmpi5
  2. Vérifier qu'Open MPI 5 est activé pour être utilisé.

    $ which mpicc

    La commande doit renvoyer le répertoire d'installation Open MPI 5 -/opt/amazon/openmpi5.

  3. (Facultatif) Pour vous assurer qu'Open MPI 5 est ajouté à la variable d'PATHenvironnement à chaque démarrage de l'instance, procédez comme suit :

    bash shell

    Ajoutez module load openmpi5 à /home/username/.bashrc et /home/username/.bash_profile.

    csh and tcsh shells

    Ajoutez module load openmpi5 à /home/username/.cshrc.

Si vous devez supprimer Open MPI 5 de la variable d'PATHenvironnement, exécutez la commande suivante et supprimez-la des scripts de démarrage de shell.

$ module unload openmpi5

Étape 5 : (Facultatif) Installer Intel MPI

Important

Vous ne devez effectuer cette étape que si vous avez l'intention d'utiliser IntelMPI. Si vous avez l'intention d'utiliser uniquement OpenMPI, passez cette étape.

Intel MPI nécessite une installation et une configuration de variable d'environnement supplémentaires.

Prérequis

Vérifiez que l’utilisateur qui exécute les étapes suivantes dispose des autorisations sudo.

Pour installer Intel MPI
  1. Pour télécharger le script MPI d'installation d'Intel, procédez comme suit :

    1. Visitez le site web d’Intel.

    2. Dans la section MPIBibliothèque Intel de la page Web, cliquez sur le lien du programme d'installation hors ligne de la MPIbibliothèque Intel pour Linux.

  2. Exécutez le script d’installation que vous avez téléchargé à l’étape précédente.

    $ sudo bash installation_script_name.sh
  3. Dans le programme d’installation, choisissez Accept & install (Accepter et installer).

  4. Lisez le programme Intel Improvement Program, choisissez l’option appropriée, puis choisissez Begin Installation (Démarrer l’installation).

  5. Une fois l’installation terminée, choisissez Fermer.

  6. Par défaut, Intel MPI utilise sa bibliothèque embarquée (interne) Libfabric. Vous pouvez configurer Intel MPI pour qu'il utilise plutôt la bibliothèque Libfabric livrée avec le EFA programme d'installation. Généralement, le EFA programme d'installation est livré avec une version de Libfabric plus récente que celle d'IntelMPI. Dans certains cas, la bibliothèque Libfabric fournie avec le EFA programme d'installation est plus performante que celle d'IntelMPI. Pour configurer Intel MPI afin qu'il utilise la bibliothèque Libfabric fournie avec le EFA programme d'installation, effectuez l'une des opérations suivantes en fonction de votre shell.

    bash shells

    Ajoutez la déclaration suivante à /home/username/.bashrc et /home/username/.bash_profile.

    export I_MPI_OFI_LIBRARY_INTERNAL=0
    csh and tcsh shells

    Ajoutez la déclaration suivante à /home/username/.cshrc.

    setenv I_MPI_OFI_LIBRARY_INTERNAL 0
  7. Ajoutez la commande source suivante à votre script shell afin d’extraire le script vars.sh du répertoire d’installation pour configurer l’environnement du compilateur à chaque démarrage de l’instance. Effectuez l’une des actions suivantes en fonction de votre shell.

    bash shells

    Ajoutez la déclaration suivante à /home/username/.bashrc et /home/username/.bash_profile.

    source /opt/intel/oneapi/mpi/latest/env/vars.sh
    csh and tcsh shells

    Ajoutez la déclaration suivante à /home/username/.cshrc.

    source /opt/intel/oneapi/mpi/latest/env/vars.csh
  8. Par défaut, si elle n'EFAest pas disponible en raison d'une mauvaise configuration, Intel MPI utilise par défaut la pile réseau TCP /IP, ce qui peut entraîner un ralentissement des performances des applications. Vous pouvez empêcher cela en définissant I_MPI_OFI_PROVIDER sur efa. Cela entraîne MPI l'échec d'Intel avec l'erreur suivante si ce n'EFAest pas disponible :

    Abort (XXXXXX) on node 0 (rank 0 in comm 0): Fatal error in PMPI_Init: OtherMPI error, MPIR_Init_thread (XXX)........: MPID_Init (XXXX)..............: MPIDI_OFI_mpi_init_hook (XXXX): open_fabric (XXXX)............: find_provider (XXXX)..........: OFI fi_getinfo() failed (ofi_init.c:2684:find_provider:

    Effectuez l’une des actions suivantes en fonction de votre shell.

    bash shells

    Ajoutez la déclaration suivante à /home/username/.bashrc et /home/username/.bash_profile.

    export I_MPI_OFI_PROVIDER=efa
    csh and tcsh shells

    Ajoutez la déclaration suivante à /home/username/.cshrc.

    setenv I_MPI_OFI_PROVIDER efa
  9. Par défaut, Intel MPI n'imprime pas d'informations de débogage. Vous pouvez spécifier différents niveaux de verbosité pour contrôler les informations de débogage. Les valeurs possibles (dans l’ordre de la quantité de détails qu’elles fournissent) sont : 0 (par défaut), 1, 2, 3, 4, 5. Le niveau 1 et les niveaux supérieurs impriment le résultat de libfabric version et de libfabric provider. libfabric versionÀ utiliser pour vérifier si Intel MPI utilise la bibliothèque Libfabric interne ou celle fournie avec le EFA programme d'installation. S’il utilise la bibliothèque Libfabric interne, la version est suffixée par impi. libfabric providerÀ utiliser pour vérifier si Intel MPI utilise EFA ou si le réseau TCP /IP. S'il utiliseEFA, la valeur estefa. S'il utilise TCP /IP, la valeur esttcp;ofi_rxm.

    Pour activer les informations de débogage, effectuez l’une des opérations suivantes en fonction de votre shell.

    bash shells

    Ajoutez la déclaration suivante à /home/username/.bashrc et /home/username/.bash_profile.

    export I_MPI_DEBUG=value
    csh and tcsh shells

    Ajoutez la déclaration suivante à /home/username/.cshrc.

    setenv I_MPI_DEBUG value
  10. Par défaut, Intel MPI utilise la mémoire partagée du système d'exploitation (shm) pour la communication intra-nœud, et elle utilise Libfabric (ofi) uniquement pour la communication inter-nœuds. En général, cette configuration fournit les meilleures performances. Toutefois, dans certains cas, la structure shm d'Intel MPI shm peut provoquer le blocage indéfini de certaines applications.

    Pour résoudre ce problème, vous pouvez forcer Intel MPI à utiliser Libfabric pour les communications intra-nœud et inter-nœuds. Pour ce faire, effectuez l’une des opérations suivantes en fonction de votre shell.

    bash shells

    Ajoutez la déclaration suivante à /home/username/.bashrc et /home/username/.bash_profile.

    export I_MPI_FABRICS=ofi
    csh and tcsh shells

    Ajoutez la déclaration suivante à /home/username/.cshrc.

    setenv I_MPI_FABRICS ofi
    Note

    Le fournisseur EFA Libfabric utilise la mémoire partagée du système d'exploitation pour la communication intra-nœud. Cela signifie que la définition de I_MPI_FABRICS sur ofi donne des performances similaires à la configuration par défaut shm:ofi.

  11. Déconnectez-vous de l’instance, puis reconnectez-vous.

Si vous ne souhaitez plus utiliser IntelMPI, supprimez les variables d'environnement des scripts de démarrage de shell.

Étape 6 : Désactiver la protection ptrace

Pour améliorer les performances de votre HPC application, Libfabric utilise la mémoire locale de l'instance pour les communications interprocessus lorsque les processus s'exécutent sur la même instance.

La fonction de mémoire partagée utilise Cross Memory Attach (CMA), non pris en charge avec la protection ptrace. Si vous utilisez une distribution Linux dans laquelle la protection ptrace est activée par défaut, telle que Ubuntu, vous devez la désactiver. Si la protection ptrace n’est pas activée par défaut dans votre distribution Linux, ignorez cette étape.

Pour désactiver la protection ptrace

Effectuez l’une des actions suivantes :

  • Pour désactiver temporairement la protection ptrace à des fins de test, exécutez la commande suivante.

    $ sudo sysctl -w kernel.yama.ptrace_scope=0
  • Pour désactiver définitivement la protection ptrace, ajoutez kernel.yama.ptrace_scope = 0à /etc/sysctl.d/10-ptrace.conf et redémarrez l’instance.

Étape 7. Confirmer l’installation

Pour confirmer la réussite de l’installation
  1. Pour vérifier que l'installation MPI a été effectuée avec succès, exécutez la commande suivante :

    $ which mpicc
    • Pour OpenMPI, le chemin renvoyé doit inclure /opt/amazon/

    • Pour IntelMPI, le chemin renvoyé doit inclure/opt/intel/. Si vous n'obtenez pas le résultat attendu, assurez-vous d'avoir obtenu le MPI vars.sh script Intel.

  2. Pour vérifier que les composants EFA logiciels et Libfabric ont été correctement installés, exécutez la commande suivante.

    $ fi_info -p efa -t FI_EP_RDM

    La commande doit renvoyer des informations sur les EFA interfaces Libfabric. L’exemple suivant illustre la sortie de la commande.

    provider: efa fabric: EFA-fe80::94:3dff:fe89:1b70 domain: efa_0-rdm version: 2.0 type: FI_EP_RDM protocol: FI_PROTO_EFA

Étape 8 : Installer votre HPC application

Installez l'HPCapplication sur l'instance temporaire. La procédure d'installation varie selon l'HPCapplication. Pour plus d'informations, consultez la section Gérer le logiciel sur votre AL2 instance dans le guide de l'utilisateur Amazon Linux 2.

Note

Reportez-vous à la documentation de votre HPC application pour obtenir des instructions d'installation.

Étape 9 : Création d'un système EFA activé AMI

Une fois que vous avez installé les composants logiciels requis, vous devez créer un AMI que vous pouvez réutiliser pour lancer vos instances EFA activées pour.

Pour créer un AMI à partir de votre instance temporaire
  1. Ouvrez la EC2 console Amazon à l'adresse https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation, choisissez Instances.

  3. Sélectionnez l’instance temporaire que vous avez créée et choisissez Actions, Image, Créer une image.

  4. Pour Créer une image, procédez comme suit :

    1. Pour Nom de l'image, saisissez un nom descriptif pour l'AMI.

    2. (Facultatif) Dans le champ Description de l'image, saisissez une brève description de l'objectif deAMI.

    3. Choisissez Create image (Créer une image).

  5. Dans le panneau de navigation, choisissez AMIs.

  6. Recherchez le à AMI l'écran que vous avez créé dans la liste. Attendez que le statut passe de pending à available avant de poursuivre avec l’étape suivante.

Étape 10 : Lancer des instances EFA activées pour dans un groupe de placement de cluster

Lancez vos instances EFA activées pour dans un groupe de placement de cluster à l'aide de l'EFAactivée pour AMI que vous avez créée à l'Étape 7 et le groupe de sécurité EFA activé pour que vous avez créé à l'Étape 1.

Note
  • Vous ne devez pas impérativement lancer vos EFA instances dans un groupe de placement de cluster. Toutefois, nous vous recommandons d'exécuter vos instances EFA activées pour dans un groupe de placement de cluster, car cela lance celles-ci dans un groupe à faible latence au sein d'une zone de disponibilité unique.

  • Pour vous assurer que la capacité est disponible lorsque vous mettez à l’échelle les instances de votre cluster, vous pouvez créer une réserve de capacité pour votre groupe de placement du cluster. Pour de plus amples informations, veuillez consulter Création de réserves de capacité dans des groupes de placement de cluster.

Pour lancer une instance
  1. Ouvrez la EC2 console Amazon à l'adresse https://console.aws.amazon.com/ec2/.

  2. Dans le volet de navigation, choisissez Instances, puis Launch Instances (Lancer des instances) pour ouvrir le nouvel assistant de lancement d’instance.

  3. (Facultatif) Dans la section Name and tags (Noms et identifications), fournissez un nom pour l’instance, tel que EFA-instance. Le nom est attribué à l’instance en tant qu’identification de ressource (Name=EFA-instance).

  4. Dans la section Application and OS Images (Mes applications et systèmes d'exploitation)AMIs, choisissez My (Mes Mes), puis sélectionnez AMI celle que vous avez créée à l'étape précédente.

  5. Dans la section Instance type (Type d’instance), sélectionnez un type d’instance pris en charge.

  6. Dans la section Key pair (Paire de clés), sélectionnez la paire de clés à utiliser pour l’instance.

  7. Dans la section Network settings (Paramètres réseau), choisissez Edit (Modifier), puis procédez comme suit :

    1. Pour Sous-réseau, choisissez le sous-réseau dans lequel lancer l’instance. Si vous ne sélectionnez pas de sous-réseau, vous ne pouvez pas activer l'instance pourEFA.

    2. Pour Firewall (security groups) (Pare-feu (groupes de sécurité)), choisissez Sélectionner un groupe de sécurité existant (Select existing security group), puis sélectionnez le groupe de sécurité que vous avez créé à l’étape précédente.

    3. Développez la section Configuration réseau avancée.

      Pour l'interface réseau 1, sélectionnez Index de la carte réseau = 0, Index du périphérique = 0 et Type d'interface = EFA avec ENA.

      (Facultatif) Si vous utilisez un type d'instance multicarte, tel que p4d.24xlarge oup5.48xlarge, pour chaque interface réseau supplémentaire requise, choisissez Ajouter une interface réseau, pour Index de carte réseau, sélectionnez le prochain index non utilisé, puis sélectionnez Index du périphérique = 1 et Type d'interface = EFA avec ENA ou EFA-only.

  8. (Facultatif) Dans la section Storage (Stockage), configurez les volumes selon vos besoins.

  9. Dans la section Advanced details (Détails avancés), pour Placement group name (Nom du groupe de placement), sélectionnez le groupe de placement du cluster dans lequel lancer les instances. Si vous avez besoin de créer un groupe de placement du cluster, choisissez Create new placement group (Créer un groupe de placement).

  10. Dans le panneau Résumé de droite, pour Nombre d'instances, entrez le nombre d'instances EFA activées que vous souhaitez lancer, puis choisissez Launch instance.

Étape 11 : Résilier l'instance temporaire

À ce stade, vous n'avez plus besoin de l'instance que vous avez lancée à l'Étape 2. Vous pouvez résilier l’instance pour arrêter d’être facturé pour celle-ci.

Pour résilier l’instance temporaire
  1. Ouvrez la EC2 console Amazon à l'adresse https://console.aws.amazon.com/ec2/.

  2. Dans le panneau de navigation, choisissez Instances.

  3. Sélectionnez l'instance temporaire que vous avez créée, puis choisissez Actions, État de l'instance, Terminer (supprimer) l'instance.

  4. Lorsque vous êtes invité à confirmer, choisissez Terminate (supprimer).

Étape 12 : Activer le sans mot de passe SSH

Pour permettre à vos applications de s'exécuter sur toutes les instances de votre cluster, vous devez activer l'SSHaccès sans mot de passe du nœud principal aux nœuds membres. Le nœud principal est l’instance à partir de laquelle vous exécutez vos applications. Les instances restantes du cluster sont les nœuds membres.

Pour activer l'absence de mot de passe SSH entre les instances du cluster
  1. Sélectionnez une instance dans le cluster en tant que nœud principal et connectez-vous à celle-ci.

  2. Désactivez strictHostKeyChecking et activez ForwardAgent sur le nœud principal. Ouvrez le fichier ~/.ssh/config à l’aide de l’éditeur de texte de votre choix et ajoutez ce qui suit.

    Host * ForwardAgent yes Host * StrictHostKeyChecking no
  3. Générez une paire de RSA clés.

    $ ssh-keygen -t rsa -N "" -f ~/.ssh/id_rsa

    La paire de clés est créée dans le répertoire $HOME/.ssh/.

  4. Modifiez les autorisations de la clé privée sur le nœud principal.

    $ chmod 600 ~/.ssh/id_rsa chmod 600 ~/.ssh/config
  5. Ouvrez ~/.ssh/id_rsa.pub à l’aide de l’éditeur de texte de votre choix et copiez la clé.

  6. Pour chaque nœud membre du cluster, procédez comme suit :

    1. Connectez-vous à l’instance.

    2. Ouvrez ~/.ssh/authorized_keys à l’aide de l’éditeur de texte de votre choix et ajoutez la clé publique que vous avez copiée plus tôt.

  7. Pour tester que le sans mot de passe SSH fonctionne comme prévu, connectez-vous à votre nœud principal et exécutez la commande suivante.

    $ ssh member_node_private_ip

    Vous devez vous connecter au nœud membre sans être invité à entrer une clé ou un mot de passe.