Utiliser pcluster update-cluster - AWS ParallelCluster

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Utiliser pcluster update-cluster

Dans AWS ParallelCluster 3.x, pcluster update-cluster analyse les paramètres utilisés pour créer le cluster actuel et les paramètres du fichier de configuration pour détecter les problèmes. Si des problèmes sont découverts, ils sont signalés et les étapes à suivre pour les résoudre sont affichées. Par exemple, si le calcul InstanceTypeest modifié, le parc informatique doit être arrêté avant qu'une mise à jour puisse avoir lieu. Ce problème est signalé lorsqu'il est découvert. Si aucun problème de blocage n'est découvert, le processus de mise à jour est lancé et les modifications sont signalées.

Vous pouvez utiliser le pcluster update-cluster --dryrun option pour voir les modifications avant leur exécution. Pour de plus amples informations, veuillez consulter Exemples pcluster update-cluster.

Pour obtenir des conseils de résolution des problèmes, consultezAWS ParallelCluster résolution des problèmes.

Politique de mise à jour : définitions

Politique de mise à jour : les nœuds de connexion du cluster doivent être arrêtés pour que ce paramètre soit modifié pour une mise à jour.

Vous ne pouvez pas modifier ces paramètres lorsque les nœuds de connexion du cluster sont en cours d'utilisation. Vous devez soit annuler la modification, soit arrêter les nœuds de connexion du cluster. (Vous pouvez arrêter les nœuds de connexion du cluster en définissant le nombre de chaque pool égal à 0). Une fois les nœuds de connexion du cluster arrêtés, vous pouvez mettre à jour le cluster (pcluster update-cluster) pour activer les modifications.

Note

Cette politique de mise à jour est prise en charge à partir de AWS ParallelCluster la version 3.7.0.

Politique de mise à jour : des pools de nœuds de connexion peuvent être ajoutés, mais la suppression d'un pool nécessite l'arrêt de tous les nœuds de connexion du cluster.

Pour supprimer un pool, vous devez arrêter tous les nœuds de connexion du cluster. (Vous pouvez arrêter les nœuds de connexion dans le cluster en définissant le nombre de chaque pool égal à 0). Une fois que les nœuds de connexion du cluster ont été arrêtés, vous pouvez mettre à jour le cluster (pcluster update-cluster) pour activer les modifications.

Note

Cette politique de mise à jour est prise en charge à partir de AWS ParallelCluster la version 3.11.0.

Politique de mise à jour : les nœuds de connexion du pool doivent être arrêtés pour que ce paramètre soit modifié pour une mise à jour.

Vous ne pouvez pas modifier ces paramètres lorsque les nœuds de connexion du pool sont utilisés. Vous devez soit annuler la modification, soit arrêter les nœuds de connexion du pool. (Vous pouvez arrêter les nœuds de connexion du pool en définissant le nombre du pool égal à 0). Une fois que les nœuds de connexion du pool ont été arrêtés, vous pouvez mettre à jour le cluster (pcluster update-cluster) pour activer les modifications.

Note

Cette politique de mise à jour est prise en charge à partir de AWS ParallelCluster la version 3.11.0.

Politique de mise à jour : ce paramètre peut être modifié lors d'une mise à jour.

Après avoir modifié ce paramètre, le cluster peut être mis à jour à l'aide depcluster update-cluster.

Politique de mise à jour : si ce paramètre est modifié, la mise à jour n'est pas autorisée.

Une fois ce paramètre modifié, le cluster ne peut pas être mis à jour. Vous devez rétablir les paramètres du cluster d'origine et créer un nouveau cluster avec les paramètres mis à jour. Vous pouvez supprimer le cluster d'origine ultérieurement. Pour créer le nouveau cluster, utilisezpcluster create-cluster. Pour supprimer le cluster d'origine, utilisezpcluster delete-cluster.

Politique de mise à jour : ce paramètre n'est pas analysé lors d'une mise à jour.

Ces paramètres peuvent être modifiés et le cluster mis à jour à l'aide depcluster update-cluster.

Politique de mise à jour : le parc informatique doit être arrêté pour que ce paramètre soit modifié pour une mise à jour.

Ces paramètres ne peuvent pas être modifiés tant que le parc informatique existe. La modification doit être annulée ou le parc informatique doit être arrêté (utilisationpcluster update-compute-fleet). Une fois le parc informatique arrêté, vous pouvez mettre à jour le cluster (pcluster update-cluster) pour activer les modifications. Par exemple, si vous utilisez un Slurm planificateur avec SlurmQueues//- ComputeResourcesName/MinCount> 0, une flotte de calcul est démarrée.

Politique de mise à jour : le parc informatique et les nœuds de connexion doivent être arrêtés pour que ce paramètre soit modifié pour une mise à jour.

Ces paramètres ne peuvent pas être modifiés tant que le parc informatique existe ou si les nœuds de connexion sont utilisés. Soit la modification doit être annulée, soit le parc de calcul et les nœuds de connexion doivent être arrêtés (le parc de calcul peut être arrêté en utilisantpcluster update-compute-fleet). Une fois que le parc informatique et les nœuds de connexion ont été arrêtés, vous pouvez mettre à jour le cluster (pcluster update-cluster) pour activer les modifications.

Politique de mise à jour : ce paramètre ne peut pas être réduit lors d'une mise à jour.

Ces paramètres peuvent être modifiés, mais ils ne peuvent pas être diminués. Si ces paramètres doivent être réduits, vous devez rétablir les paramètres du cluster d'origine et créer un nouveau cluster avec les paramètres mis à jour. Vous pouvez supprimer le cluster d'origine ultérieurement. Pour créer le nouveau cluster, utilisezpcluster create-cluster. Pour supprimer le cluster d'origine, utilisezpcluster delete-cluster.

Politique de mise à jour : si ce paramètre est modifié, la mise à jour n'est pas autorisée. Si vous forcez la mise à jour, la nouvelle valeur sera ignorée et l'ancienne valeur sera utilisée.

Une fois ce paramètre modifié, le cluster ne peut pas être mis à jour. Vous devez rétablir les paramètres du cluster d'origine et créer un nouveau cluster avec les paramètres mis à jour. Vous pouvez supprimer le cluster d'origine ultérieurement. Pour créer le nouveau cluster, utilisezpcluster create-cluster. Pour supprimer le cluster d'origine, utilisezpcluster delete-cluster.

Politique de mise à jour : le parc informatique doit être arrêté ou QueueUpdateStrategydéfini pour que ce paramètre soit modifié en vue d'une mise à jour.

Ces paramètres peuvent être modifiés. Le parc informatique doit être arrêté (utilisépcluster update-compute-fleet) ou QueueUpdateStrategydoit être défini. Une fois le parc informatique arrêté ou QueueUpdateStrategydéfini, vous pouvez mettre à jour le cluster (pcluster update-cluster) pour activer les modifications.

Note

Cette politique de mise à jour est prise en charge à partir de AWS ParallelCluster la version 3.2.0.

Politique de mise à jour : pour ce paramètre de valeurs de liste, une nouvelle valeur peut être ajoutée lors d'une mise à jour ou le parc informatique doit être arrêté lors de la suppression d'une valeur existante.

Une nouvelle valeur pour ces paramètres peut être ajoutée lors d'une mise à jour. Après avoir ajouté une nouvelle valeur à la liste, le cluster peut être mis à jour à l'aide de (pcluster update-cluster).

Pour supprimer une valeur existante de la liste, le parc informatique doit être arrêté (en utilisantpcluster update-compute-fleet).

Par exemple, si vous utilisez un Slurm planificateur et en ajoutant un nouveau type d'instance à Instances/ InstanceType, vous pouvez mettre à jour le cluster sans arrêter le parc informatique. Pour supprimer un type d'instance existant dans Instances/ InstanceType, le parc de calcul doit d'abord être arrêté (à l'aide de update-compute-fleetpcluster).

Note

Cette politique de mise à jour est prise en charge à partir de AWS ParallelCluster la version 3.2.0.

Politique de mise à jour : la réduction de la taille d'une file d'attente nécessite l'arrêt du parc informatique ou QueueUpdateStrategydoit être définie sur cette TERMINATE valeur pour que ce paramètre soit modifié pour une mise à jour.

Ces paramètres peuvent être modifiés, mais si la modification réduit la taille de la file d'attente, le parc de calcul doit être arrêté (à l'aide de pcluster update-compute-fleet) ou QueueUpdateStrategydoit être défini sur. TERMINATE Une fois que le parc informatique est arrêté ou QueueUpdateStrategydéfini surTERMINATE, vous pouvez mettre à jour le cluster (pcluster update-cluster) pour activer les modifications.

L'TERMINATEensemble, lors du redimensionnement de la capacité du cluster, ne terminera que les nœuds figurant au bas de la liste des nœuds et laissera intacts tous les autres nœuds de la même partition.

Par exemple, si la capacité initiale du cluster est égale à MinCount = 5 etMaxCount = 10, les nœuds le sontst-[1-5]; dy-[1-5]. Lors du redimensionnement du cluster sur MinCount = 3 etMaxCount = 5, la nouvelle capacité du cluster sera composée par les nœudsst-[1-3]; dy-[1-2], qui ne seront pas modifiés lors de la mise à jour. Seuls les nœuds st-[4-5]; dy-[3-5] seront interrompus lors de la mise à jour.

Les modifications suivantes sont prises en charge et ne nécessitent pas l'arrêt du parc informatique ni son QueueUpdateStrategyréglage sur TERMINATE :

  • Un nouveau SlurmQueueest ajouté

  • Un nouveau ComputeResourceest ajouté

  • MaxCountest augmenté

  • MinCountest augmenté et MaxCountest augmenté d'au moins le même montant

    Remarque : Cette politique de mise à jour est prise en charge à partir de AWS ParallelCluster la version 3.9.0.

Politique de mise à jour : pour ce paramètre de valeurs de liste, le parc de calcul QueueUpdateStrategydoit être arrêté ou configuré pour ajouter une nouvelle valeur ; le parc de calcul doit être arrêté lors de la suppression d'une valeur existante.

Une nouvelle valeur pour ces paramètres peut être ajoutée lors d'une mise à jour. Le parc informatique doit être arrêté (utilisépcluster update-compute-fleet) ou QueueUpdateStrategydoit être défini. Une fois le parc informatique arrêté ou QueueUpdateStrategydéfini, vous pouvez mettre à jour le cluster (pcluster update-cluster) pour activer les modifications.

Pour supprimer une valeur existante de la liste, le parc informatique doit être arrêté (en utilisantpcluster update-compute-fleet).

Note

Cette politique de mise à jour est prise en charge à partir de AWS ParallelCluster la version 3.3.0.

Politique de mise à jour : tous les nœuds de calcul doivent être arrêtés pour la suppression d'un groupe de placement géré. Le parc informatique doit être arrêté ou QueueUpdateStrategydéfini pour que ce paramètre soit modifié en vue d'une mise à jour.

Le parc informatique doit être arrêté (utilisépcluster update-compute-fleet) afin de supprimer un groupe de placement géré. Si vous exécutez une mise à jour du cluster pour supprimer un groupe de placement géré avant d'arrêter le parc informatique, un message de configuration non valide est renvoyé et la mise à jour ne se poursuit pas. L'arrêt du parc informatique garantit qu'aucune instance n'est en cours d'exécution.

Exemples pcluster update-cluster

Ces paramètres peuvent être modifiés, mais si la modification réduit la taille de la file d'attente, le parc de calcul doit être arrêté (à l'aide de pcluster update-compute-fleet) ou QueueUpdateStrategydoit être défini sur. TERMINATE Une fois que le parc informatique est arrêté ou QueueUpdateStrategydéfini surTERMINATE, vous pouvez mettre à jour le cluster (pcluster update-cluster) pour activer les modifications.

  • Cet exemple illustre une mise à jour avec certaines modifications autorisées et la mise à jour est lancée directement.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 { "cluster": { "clusterName": cluster_name, "cloudformationStackStatus": "UPDATE_IN_PROGRESS", "cloudformationStackArn": stack_arn, "region": "us-east-1", "version": "3.7.0", "clusterStatus": "UPDATE_IN_PROGRESS" }, "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
  • Cet exemple illustre une mise à jour à sec avec certaines modifications autorisées. Dryrun est utile pour signaler le changement défini sans démarrer la mise à jour.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 --dryrun true { "message": "Request would have succeeded, but DryRun flag is set.", "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
  • Cet exemple illustre une mise à jour avec certaines modifications qui bloquent la mise à jour.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 { "message": "Update failure", "updateValidationErrors": [ { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "message": "Update actions are not currently supported for the 'KeyName' parameter. Restore 'KeyName' value to 'jenkinsjun'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "message": "All compute nodes must be stopped. Stop the compute fleet with the pcluster update-compute-fleet command", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "message": "Update actions are not currently supported for the 'MountDir' parameter. Restore 'MountDir' value to '/shared'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "/shared" } ], "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] }, { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "currentValue": "/shared" } ] }