Mode de file d'attente multiple - AWS ParallelCluster

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Mode de file d'attente multiple

AWS ParallelCluster la version 2.9.0 a introduit le mode de file d'attente multiple. Le mode de file d'attente multiple est pris en charge lorsqu'il scheduler est défini sur slurm et que le queue_settings paramètre est défini. Ce mode permet à différents types d'instances de coexister dans les nœuds de calcul. Les ressources de calcul qui contiennent les différents types d'instances peuvent être augmentées ou diminuées selon les besoins. En mode file d'attente, jusqu'à cinq (5) files d'attente sont prises en charge, et chaque [queue]section peut faire référence à un maximum de trois (3) [compute_resource]sections. Chacune de ces [queue]sections est une partition dans Slurm Workload Manager. Pour plus d'informations, reportez-vous Slurm guide pour le mode de file d'attente multiple aux sections etTutoriel en mode file d'attente.

Chaque [compute_resource]section d'une file d'attente doit avoir un type d'instance différent, et chacune d'entre elles [compute_resource] est ensuite divisée en nœuds statiques et dynamiques. Les nœuds statiques de chacun [compute_resource] sont numérotés de 1 à la valeur demin_count. Les nœuds dynamiques de chacun [compute_resource] sont numérotés de un (1) à (max_count-min_count). Par exemple, si la valeur min_count max_count est 2 et 10, les nœuds dynamiques correspondants [compute_resource] sont numérotés de un (1) à huit (8). À tout moment, il peut y avoir entre zéro (0) et le nombre maximum de nœuds dynamiques dans [compute_resource] a.

Les instances lancées dans le parc informatique sont attribuées dynamiquement. Pour faciliter cette gestion, des noms d'hôtes sont générés pour chaque nœud. Le format du nom d'hôte est le suivant :

$HOSTNAME=$QUEUE-$STATDYN-$INSTANCE_TYPE-$NODENUM

  • $QUEUEest le nom de la file d'attente. Par exemple, si la section commence[queue queue-name], « $QUEUE » est »queue-name”.

  • $STATDYNest st destiné aux nœuds statiques ou dy aux nœuds dynamiques.

  • $INSTANCE_TYPEest le type d'instance pour le[compute_resource], à partir du instance_type paramètre.

  • $NODENUMest le numéro du nœud. $NODENUMest compris entre un (1) et la valeur de min_count pour les nœuds statiques et entre un (1) et (max_count-min_count) pour les nœuds dynamiques.

Les noms d'hôte et les noms de domaine complets (FQDN) sont créés à l'aide des zones hébergées Amazon Route 53. FQDNC'est$HOSTNAME.$CLUSTERNAME.pcluster, où $CLUSTERNAME est le nom de la [cluster]section utilisée pour le cluster.

Pour convertir votre configuration en mode file d'attente, utilisez la pcluster-config convert commande. Il écrit une configuration mise à jour avec une seule [queue]section nommée[queue compute]. Cette file d'attente contient une seule [compute_resource]section nommée[compute_resource default]. Les paramètres [queue compute] et ont [compute_resource default] été migrés depuis la [cluster]section spécifiée.