[queue] Section - AWS ParallelCluster

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

[queue] Section

Définit les paramètres de configuration pour une file d'attente unique. [queue]les sections ne sont prises en charge que lorsqu'elles scheduler sont définies surslurm.

Le format est[queue <queue-name>]. queue-name doit commencer par une lettre minuscule, ne pas contenir plus de 30 caractères et uniquement contenir des lettres minuscules, des chiffres et des tirets (-).

[queue q1] compute_resource_settings = i1,i2 placement_group = DYNAMIC enable_efa = true disable_hyperthreading = false compute_type = spot
Note

Support pour [queue]cette section a été ajouté dans la AWS ParallelCluster version 2.9.0.

compute_resource_settings

(Obligatoire) Identifie les [compute_resource]sections contenant les configurations des ressources de calcul pour cette file d'attente. Les noms des sections doivent commencer par une lettre, ne pas contenir plus de 30 caractères et contenir uniquement des lettres, des chiffres, des traits d'union (-) et des traits de soulignement (_).

Jusqu'à trois (3) [compute_resource]sections sont prises en charge pour chaque [queue]section.

Par exemple, le paramètre suivant indique que les sections qui démarrent [compute_resource cr1] et [compute_resource cr2] sont utilisées.

compute_resource_settings = cr1, cr2

Politique de mise à jour : si ce paramètre est modifié, la mise à jour n'est pas autorisée.

compute_type

(Facultatif) Définit le type d'instances à lancer pour cette file d'attente. Ce paramètre remplace le paramètre cluster_type.

Les options valides sont ondemand et spot.

La valeur par défaut est ondemand.

Pour plus d'informations sur les instances Spot, consultez Utilisation de instances Spot.

Note

L'utilisation d'instances Spot nécessite que le rôle AWSServiceRoleForEC2Spot lié au service existe dans votre compte. Pour créer ce rôle dans votre compte à l'aide de AWS CLI, exécutez la commande suivante :

aws iam create-service-linked-role --aws-service-name spot.amazonaws.com

Pour plus d'informations, consultez la section Rôle lié au service pour les demandes d'instance Spot dans le guide de l'utilisateur Amazon EC2.

L'exemple suivant utilise SpotInstances les nœuds de calcul de cette file d'attente.

compute_type = spot

Politique de mise à jour : le parc informatique doit être arrêté pour que ce paramètre soit modifié en vue d'une mise à jour.

disable_hyperthreading

(Facultatif) Désactive l'hyperthreading sur les nœuds de cette file d'attente. Tous les types d'instance ne peuvent pas désactiver l'hyper-threading. Pour obtenir la liste des types d'instances qui prennent en charge la désactivation de l'hyperthreading, consultez la section Cœurs et threads de processeur pour chaque cœur de processeur par type d'instance dans le guide de l'utilisateur Amazon EC2. Si le disable_hyperthreading paramètre de la [cluster]section est défini, il ne peut pas être défini.

La valeur par défaut est false.

disable_hyperthreading = true

Politique de mise à jour : le parc informatique doit être arrêté pour que ce paramètre soit modifié en vue d'une mise à jour.

enable_efa

(Facultatif) Si ce paramètre est défini surtrue, indique qu'Elastic Fabric Adapter (EFA) est activé pour les nœuds de cette file d'attente. Pour consulter la liste des instances EC2 qui prennent en charge l'EFA, consultez la section Types d'instances pris en charge dans le Guide de l'utilisateur Amazon EC2 pour les instances Linux. Si le enable_efa paramètre de la [cluster]section est défini, il ne peut pas être défini. Un groupe de placement de cluster doit être utilisé pour minimiser les latences entre les instances. Pour plus d’informations, consultez placement et placement_group.

enable_efa = true

Politique de mise à jour : le parc informatique doit être arrêté pour que ce paramètre soit modifié en vue d'une mise à jour.

enable_efa_gdr

(Facultatif) À partir de AWS ParallelCluster la version 2.11.3, ce paramètre n'a aucun effet. Le support d'Elastic Fabric Adapter (EFA) pour GPUDirect RDMA (accès direct à distance à la mémoire) est activé pour les nœuds de calcul. Il est toujours activé s'il est pris en charge par le type d'instance.

Note

AWS ParallelCluster versions 2.10.0 à 2.11.2 : sitrue, indique qu'Elastic Fabric Adapter (EFA) GPUDirect RDMA (accès direct à la mémoire à distance) est activé pour les nœuds de cette file d'attente. La définition de cette true valeur nécessite que le enable_efa paramètre soit défini sur true .EFA GPUDirect RDMA est pris en charge par les types d'instances suivants (p4d.24xlarge) sur ces systèmes d'exploitation (alinux2,centos7, ubuntu1804 ou). ubuntu2004 Si le enable_efa_gdr paramètre de la [cluster]section est défini, il ne peut pas être défini. Un groupe de placement de cluster doit être utilisé pour minimiser les latences entre les instances. Pour plus d’informations, consultez placement et placement_group.

La valeur par défaut est false.

enable_efa_gdr = true
Note

Support pour enable_efa_gdr a été ajouté dans la AWS ParallelCluster version 2.10.0.

Politique de mise à jour : le parc informatique doit être arrêté pour que ce paramètre soit modifié en vue d'une mise à jour.

placement_group

(Facultatif) Le cas échéant, définit le groupe de placement pour cette file d'attente. Ce paramètre remplace le paramètre placement_group.

Les options valides sont les valeurs suivantes :

  • DYNAMIC

  • Nom d'un groupe de placement de clusters Amazon EC2 existant

Lorsque ce paramètre est défini surDYNAMIC, un groupe de placement unique pour cette file d'attente est créé et supprimé dans le cadre de la pile de clusters.

Pour plus d'informations sur les groupes de placement, consultez la section Groupes de placement dans le guide de l'utilisateur Amazon EC2. Si le même groupe de placement est utilisé pour différents types d'instances, il est plus probable que la demande échoue en raison d'une erreur de capacité insuffisante. Pour plus d'informations, consultez la section Capacité d'instance insuffisante dans le guide de l'utilisateur Amazon EC2.

Il n'existe aucune valeur par défaut.

Tous les types d'instance ne prennent pas en charge les groupes de placement de cluster. Par exemple, t2.micro ne prend pas en charge les groupes de placement en cluster. Pour plus d'informations sur la liste des types d'instances qui prennent en charge les groupes de placement de clusters, consultez la section Règles et limites des groupes de placement de clusters dans le guide de l'utilisateur Amazon EC2. Consultez Problèmes liés aux groupes de placement et au lancement d'instances pour obtenir des conseils pour l'utilisation des groupes de placement.

placement_group = DYNAMIC

Politique de mise à jour : le parc informatique doit être arrêté pour que ce paramètre soit modifié en vue d'une mise à jour.