Verwenden von pcluster update-cluster - AWS ParallelCluster

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden von pcluster update-cluster

pcluster update-clusterAnalysiert in AWS ParallelCluster 3.x die Einstellungen, die zum Erstellen des aktuellen Clusters verwendet wurden, und die Einstellungen in der Konfigurationsdatei auf Probleme. Wenn Probleme entdeckt werden, werden sie gemeldet, und es werden die Schritte zur Behebung der Probleme angezeigt. Wenn beispielsweise die Rechenleistung geändert InstanceTypewird, muss die Rechenflotte gestoppt werden, bevor ein Update durchgeführt werden kann. Dieses Problem wird gemeldet, wenn es entdeckt wird. Wenn keine Blockierungsprobleme festgestellt werden, wird der Aktualisierungsvorgang gestartet und die Änderungen werden gemeldet.

Sie können den verwenden pcluster update-cluster--dryrun option, um die Änderungen vor ihrer Ausführung zu sehen. Weitere Informationen finden Sie unter Beispiele für pcluster update-cluster.

Anleitungen zur Fehlerbehebung finden Sie unterAWS ParallelCluster Problembehandlung.

Richtlinie aktualisieren: Definitionen

Richtlinie aktualisieren: Die Anmeldeknoten im Cluster müssen gestoppt werden, damit diese Einstellung für ein Update geändert werden kann.

Sie können diese Einstellungen nicht ändern, solange die Anmeldeknoten im Cluster verwendet werden. Entweder müssen Sie die Änderung rückgängig machen, oder Sie müssen die Anmeldeknoten des Clusters beenden. (Sie können die Anmeldeknoten im Cluster beenden, indem Sie die Anzahl der Pools auf 0 setzen). Nachdem die Anmeldeknoten des Clusters gestoppt wurden, können Sie den Cluster aktualisieren (pcluster update-cluster), um die Änderungen zu aktivieren.

Anmerkung

Diese Aktualisierungsrichtlinie wird ab Version 3.7.0 unterstützt. AWS ParallelCluster

Aktualisierungsrichtlinie: Anmeldeknotenpools können hinzugefügt werden, aber um einen Pool zu entfernen, müssen alle Anmeldeknoten im Cluster gestoppt werden.

Um einen Pool zu entfernen, müssen Sie alle Anmeldeknoten im Cluster beenden. (Sie können die Anmeldeknoten im Cluster beenden, indem Sie die Anzahl der Pools auf 0 setzen). Nachdem die Anmeldeknoten des Clusters gestoppt wurden, können Sie den Cluster (pcluster update-cluster) aktualisieren, um die Änderungen zu aktivieren.

Anmerkung

Diese Aktualisierungsrichtlinie wird ab AWS ParallelCluster Version 3.11.0 unterstützt.

Aktualisierungsrichtlinie: Die Anmeldeknoten im Pool müssen gestoppt werden, damit diese Einstellung für ein Update geändert werden kann.

Sie können diese Einstellungen nicht ändern, solange die Anmeldeknoten im Pool verwendet werden. Entweder müssen Sie die Änderung rückgängig machen, oder Sie müssen die Anmeldeknoten des Pools beenden. (Sie können die Anmeldeknoten im Pool beenden, indem Sie die Anzahl des Pools auf 0 setzen). Nachdem die Anmeldeknoten des Pools gestoppt wurden, können Sie den Cluster (pcluster update-cluster) aktualisieren, um die Änderungen zu aktivieren.

Anmerkung

Diese Aktualisierungsrichtlinie wird ab AWS ParallelCluster Version 3.11.0 unterstützt.

Aktualisierungsrichtlinie: Diese Einstellung kann während eines Updates geändert werden.

Nach dem Ändern dieser Einstellung kann der Cluster mit aktualisiert werdenpcluster update-cluster.

Aktualisierungsrichtlinie: Wenn diese Einstellung geändert wird, ist das Update nicht zulässig.

Nach dem Ändern dieser Einstellung kann der Cluster nicht aktualisiert werden. Sie müssen die Einstellungen für den ursprünglichen Cluster rückgängig machen und einen neuen Cluster mit den aktualisierten Einstellungen erstellen. Sie können den ursprünglichen Cluster zu einem späteren Zeitpunkt löschen. Um den neuen Cluster zu erstellen, verwenden Siepcluster create-cluster. Um den ursprünglichen Cluster zu löschen, verwenden Siepcluster delete-cluster.

Aktualisierungsrichtlinie: Diese Einstellung wird während eines Updates nicht analysiert.

Diese Einstellungen können geändert und der Cluster aktualisiert werden mitpcluster update-cluster.

Aktualisierungsrichtlinie: Die Rechenflotte muss gestoppt werden, damit diese Einstellung für ein Update geändert werden kann.

Diese Einstellungen können nicht geändert werden, solange die Compute-Flotte existiert. Entweder muss die Änderung rückgängig gemacht werden, oder die Rechenflotte muss gestoppt (verwendetpcluster update-compute-fleet) werden. Nachdem die Compute-Flotte gestoppt wurde, können Sie den Cluster (pcluster update-cluster) aktualisieren, um die Änderungen zu aktivieren. Wenn Sie beispielsweise eine verwenden Slurm Scheduler mit SlurmQueues/ComputeResources/- Name/MinCount> 0 wird eine Rechenflotte gestartet.

Richtlinie aktualisieren: Die Rechenflotte und die Anmeldeknoten müssen gestoppt werden, damit diese Einstellung für ein Update geändert werden kann.

Diese Einstellungen können nicht geändert werden, solange die Rechenflotte existiert oder wenn die Anmeldeknoten verwendet werden. Entweder muss die Änderung rückgängig gemacht werden oder die Rechenflotte und die Anmeldeknoten müssen gestoppt werden (die Compute-Flotte kann nicht mehr verwendet werdenpcluster update-compute-fleet). Nachdem die Rechenflotte und die Anmeldeknoten gestoppt wurden, können Sie den Cluster (pcluster update-cluster) aktualisieren, um die Änderungen zu aktivieren.

Aktualisierungsrichtlinie: Diese Einstellung kann während eines Updates nicht verringert werden.

Diese Einstellungen können geändert, aber nicht verringert werden. Wenn diese Einstellungen verringert werden müssen, müssen Sie die Einstellungen für den ursprünglichen Cluster rückgängig machen und einen neuen Cluster mit den aktualisierten Einstellungen erstellen. Sie können den ursprünglichen Cluster zu einem späteren Zeitpunkt löschen. Um den neuen Cluster zu erstellen, verwenden Siepcluster create-cluster. Um den ursprünglichen Cluster zu löschen, verwenden Siepcluster delete-cluster.

Aktualisierungsrichtlinie: Wenn diese Einstellung geändert wird, ist das Update nicht zulässig. Wenn Sie das Update erzwingen, wird der neue Wert ignoriert und der alte Wert wird verwendet.

Nach dem Ändern dieser Einstellung kann der Cluster nicht aktualisiert werden. Sie müssen die Einstellungen für den ursprünglichen Cluster rückgängig machen und einen neuen Cluster mit den aktualisierten Einstellungen erstellen. Sie können den ursprünglichen Cluster zu einem späteren Zeitpunkt löschen. Um den neuen Cluster zu erstellen, verwenden Siepcluster create-cluster. Um den ursprünglichen Cluster zu löschen, verwenden Siepcluster delete-cluster.

Richtlinie aktualisieren: Die Rechenflotte muss gestoppt oder QueueUpdateStrategyeingerichtet sein, damit diese Einstellung für ein Update geändert werden kann.

Diese Einstellungen können geändert werden. Entweder muss die Rechenflotte gestoppt (verwendetpcluster update-compute-fleet) oder sie QueueUpdateStrategymuss eingerichtet werden. Nachdem die Rechenflotte gestoppt oder QueueUpdateStrategyeingerichtet wurde, können Sie den Cluster (pcluster update-cluster) aktualisieren, um die Änderungen zu aktivieren.

Anmerkung

Diese Aktualisierungsrichtlinie wird ab AWS ParallelCluster Version 3.2.0 unterstützt.

Richtlinie aktualisieren: Bei dieser Einstellung für Listenwerte kann während eines Updates ein neuer Wert hinzugefügt werden, oder die Rechenflotte muss gestoppt werden, wenn ein vorhandener Wert entfernt wird.

Ein neuer Wert für diese Einstellungen kann während eines Updates hinzugefügt werden. Nachdem der Liste ein neuer Wert hinzugefügt wurde, kann der Cluster mit (pcluster update-cluster) aktualisiert werden.

Um einen vorhandenen Wert aus der Liste zu entfernen, muss die Rechenflotte gestoppt werden (mitpcluster update-compute-fleet).

Wenn Sie beispielsweise eine verwenden Slurm Scheduler und Hinzufügen eines neuen Instanztyps zu Instances/ können Sie den Cluster aktualisierenInstanceType, ohne die Rechenflotte anzuhalten. Um einen vorhandenen Instanztyp aus Instances/ zu entfernenInstanceType, muss zuerst die Rechenflotte gestoppt werden (mit pcluster). update-compute-fleet

Anmerkung

Diese Update-Richtlinie wird ab Version 3.2.0 unterstützt. AWS ParallelCluster

Aktualisierungsrichtlinie: Um die Größe einer Warteschlange zu reduzieren, QueueUpdateStrategymuss die Rechenflotte gestoppt oder auf eingestellt sein, damit diese Einstellung TERMINATE für ein Update geändert werden kann.

Diese Einstellungen können geändert werden, aber wenn die Änderung die Größe der Warteschlange verringern würde, muss die Rechenflotte gestoppt (mithilfe von pcluster update-compute-fleet) oder QueueUpdateStrategyauf TERMINATE eingestellt werden. Nachdem die Compute-Flotte gestoppt oder QueueUpdateStrategyauf eingestellt wurdeTERMINATE, können Sie den Cluster aktualisieren (pcluster update-cluster), um die Änderungen zu aktivieren.

Wenn TERMINATE Sie die Kapazität des Clusters ändern, werden nur die Knoten beendet, die sich am Ende der Knotenliste befinden, und alle anderen Knoten derselben Partition bleiben unberührt.

Wenn beispielsweise die Anfangskapazität des Clusters MinCount = 5 und istMaxCount = 10, sind es auch die Knoten. st-[1-5]; dy-[1-5] Wenn Sie die Größe des Clusters auf MinCount = 3 und ändernMaxCount = 5, wird die neue Clusterkapazität aus den Knoten zusammengesetztst-[1-3]; dy-[1-2], die bei der Aktualisierung nicht verändert werden. Nur die Knoten st-[4-5]; dy-[3-5] werden während des Updates beendet.

Die folgenden Änderungen werden unterstützt und erfordern weder das Stoppen der Rechenflotte noch QueueUpdateStrategyderen EinstellungTERMINATE:

  • Eine neue SlurmQueuewird hinzugefügt

  • Ein neues ComputeResourcewird hinzugefügt

  • MaxCountist erhöht

  • MinCountist erhöht und MaxCountwird um mindestens den gleichen Betrag erhöht

    Hinweis: Diese Aktualisierungsrichtlinie wird ab AWS ParallelCluster Version 3.9.0 unterstützt.

Richtlinie aktualisieren: Für diese Einstellung mit Listenwerten muss die Rechenflotte gestoppt oder QueueUpdateStrategyso eingestellt werden, dass sie einen neuen Wert hinzufügt. Die Rechenflotte muss gestoppt werden, wenn ein vorhandener Wert entfernt wird.

Ein neuer Wert für diese Einstellungen kann während eines Updates hinzugefügt werden. Entweder muss die Rechenflotte gestoppt (verwendetpcluster update-compute-fleet) oder sie QueueUpdateStrategymuss eingerichtet werden. Nachdem die Rechenflotte gestoppt oder QueueUpdateStrategyeingerichtet wurde, können Sie den Cluster (pcluster update-cluster) aktualisieren, um die Änderungen zu aktivieren.

Um einen vorhandenen Wert aus der Liste zu entfernen, muss die Rechenflotte gestoppt (verwendetpcluster update-compute-fleet) werden.

Anmerkung

Diese Aktualisierungsrichtlinie wird ab AWS ParallelCluster Version 3.3.0 unterstützt.

Aktualisierungsrichtlinie: Alle Rechenknoten müssen gestoppt werden, damit eine verwaltete Platzierungsgruppe gelöscht werden kann. Die Rechenflotte muss gestoppt oder QueueUpdateStrategyeingerichtet sein, damit diese Einstellung für ein Update geändert werden kann.

Die Rechenflotte muss gestoppt (verwendetpcluster update-compute-fleet) werden, um eine verwaltete Platzierungsgruppe zu entfernen. Wenn Sie ein Cluster-Update ausführen, um eine verwaltete Platzierungsgruppe zu entfernen, bevor Sie die Rechenflotte beenden, wird eine ungültige Konfigurationsmeldung zurückgegeben und das Update wird nicht fortgesetzt. Durch das Stoppen der Rechenflotte wird garantiert, dass keine Instances ausgeführt werden.

Beispiele für pcluster update-cluster

Diese Einstellungen können geändert werden, aber wenn die Änderung die Größe der Warteschlange verringern würde, muss die Rechenflotte gestoppt (mit pcluster update-compute-fleet) oder QueueUpdateStrategyauf TERMINATE eingestellt werden. Nachdem die Compute-Flotte gestoppt oder QueueUpdateStrategyauf eingestellt wurdeTERMINATE, können Sie den Cluster aktualisieren (pcluster update-cluster), um die Änderungen zu aktivieren.

  • Dieses Beispiel zeigt ein Update mit einigen zulässigen Änderungen und das Update wird direkt gestartet.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 { "cluster": { "clusterName": cluster_name, "cloudformationStackStatus": "UPDATE_IN_PROGRESS", "cloudformationStackArn": stack_arn, "region": "us-east-1", "version": "3.7.0", "clusterStatus": "UPDATE_IN_PROGRESS" }, "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
  • Dieses Beispiel zeigt ein Testrun-Update mit einigen erlaubten Änderungen. Dryrun ist nützlich, um den Änderungssatz zu melden, ohne das Update zu starten.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 --dryrun true { "message": "Request would have succeeded, but DryRun flag is set.", "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
  • Dieses Beispiel zeigt ein Update mit einigen Änderungen, die das Update blockieren.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 { "message": "Update failure", "updateValidationErrors": [ { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "message": "Update actions are not currently supported for the 'KeyName' parameter. Restore 'KeyName' value to 'jenkinsjun'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "message": "All compute nodes must be stopped. Stop the compute fleet with the pcluster update-compute-fleet command", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "message": "Update actions are not currently supported for the 'MountDir' parameter. Restore 'MountDir' value to '/shared'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "/shared" } ], "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] }, { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "currentValue": "/shared" } ] }