Configuration de plusieurs files d'attente - AWS ParallelCluster

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Configuration de plusieurs files d'attente

Avec AWS ParallelCluster la version 3, vous pouvez configurer plusieurs files d'attente en définissant le Schedulerà slurm et en spécifiant plusieurs files d'attente SlurmQueues dans le fichier de configuration. Dans ce mode, différents types d'instances coexistent dans les nœuds de calcul spécifiés dans la ComputeResources section du fichier de configuration. ComputeResourcesavec différents types d'instances sont redimensionnés à la hausse ou à la baisse selon les besoins duSlurmQueues.

Quotas de ressources de calcul et files d'attente du cluster
Ressource Quota

Slurm queues

50 files d'attente par cluster

Compute resources

50 ressources de calcul par file d'attente

50 ressources de calcul par cluster

Nombre de nœuds

Chaque ressource de calcul ComputeResourcesd'une file d'attente doit avoir un Namecaractère unique InstanceType, MinCount, et MaxCount. MinCountet MaxCountont des valeurs par défaut qui définissent la plage d'instances d'une ressource de calcul dans ComputeResourcesune file d'attente. Vous pouvez également spécifier vos propres valeurs pour MinCountet MaxCount. Chaque ressource de calcul ComputeResourcesest composée de nœuds statiques numérotés de 1 à la valeur de MinCountet de nœuds dynamiques numérotés de la valeur de MinCountà la valeur de MaxCount.

Exemple de configuration

Voici un exemple de section de planification pour un fichier de configuration de cluster. Dans cette configuration, deux files d'attente sont nommées queue1 queue2 et chacune d'entre elles possède un nom ComputeResourcesspécifié. MaxCount

Scheduling: Scheduler: slurm SlurmQueues: - Name: queue1 ComputeResources: - InstanceType: c5.xlarge MaxCount: 5 Name: c5xlarge - InstanceType: c4.xlarge MaxCount: 5 Name: c4xlarge - Name: queue2 ComputeResources: - InstanceType: c5.xlarge MaxCount: 5 Name: c5xlarge

Noms d'hôtes

Les instances lancées dans le parc informatique sont attribuées dynamiquement. Les noms d'hôtes sont générés pour chaque nœud. Par défaut AWS ParallelCluster , le format du nom d'hôte sera le suivant :

$HOSTNAME=$QUEUE-$STATDYN-$COMPUTE_RESOURCE-$NODENUM

  • $QUEUEest le nom de la file d'attente. Par exemple, si la SlurmQueuessection comporte une entrée Namedéfinie sur « queue-name », alors « $QUEUE » est « queue-name ».

  • $STATDYNest st destiné aux nœuds statiques ou dy aux nœuds dynamiques.

  • $COMPUTE_RESOURCEest le Namede la ressource de ComputeResourcescalcul correspondant à ce nœud.

  • $NODENUMest le numéro du nœud. $NODENUMest compris entre un (1) et la valeur de MinCountpour les nœuds statiques et entre un (1) et MaxCount- MinCountpour les nœuds dynamiques.

Dans l'exemple de fichier de configuration ci-dessus, un nœud donné queue1 et une ressource de calcul c5xlarge ont un nom d'hôte :queue1-dy-c5xlarge-1.

Les noms d'hôte et les noms de domaine complets (FQDN) sont créés à l'aide des zones hébergées Amazon Route 53. FQDNC'est$HOSTNAME.$CLUSTERNAME.pcluster, où se $CLUSTERNAME trouve le nom du cluster.

Notez que le même format sera utilisé pour Slurm noms de nœuds également.

Les utilisateurs peuvent choisir d'utiliser le EC2 nom d'hôte Amazon par défaut de l'instance alimentant le nœud de calcul au lieu du format de nom d'hôte par défaut utilisé par AWS ParallelCluster. Cela peut être fait en réglant le UseEc2Hostnamesparamètre sur true. Cependant, Slurm les noms de nœuds continueront d'utiliser le AWS ParallelCluster format par défaut.