As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Usar o pcluster
update-cluster
Na AWS ParallelCluster versão 3.x, pcluster update-cluster analisa as configurações usadas para criar o cluster atual e as configurações no arquivo de configuração em busca de problemas. Se algum problema for descoberto, ele será relatado e as etapas a serem seguidas para corrigi-los serão exibidas. Por exemplo, se a InstanceType de computação for alterada, a frota de computação deverá ser interrompida antes que uma atualização possa continuar. Esse problema é relatado quando é descoberto. Se nenhum problema de bloqueio for descoberto, o processo de atualização será iniciado e as alterações serão relatadas.
Você pode usar o pcluster update-cluster --dryrun option
para ver as alterações antes de serem executadas. Para obter mais informações, consulte Exemplos do pcluster update-cluster.
Para obter ajuda de solução de problemas, consulte AWS ParallelCluster solução de problemas.
Política de atualização: definições
- Política de atualização: os nós de login no cluster devem ser interrompidos para que essa configuração seja alterada para uma atualização.
-
Você não pode alterar essas configurações enquanto os nós de login no cluster estão em uso. Ou você deve reverter a alteração ou interromper os nós de login do cluster. (Você pode interromper os nós de login no cluster definindo a contagem de cada pool igual a 0). Depois que os nós de login do cluster forem interrompidos, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.
nota
Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.7.0.
- Política de atualização: grupos de nós de login podem ser adicionados, mas a remoção de um pool exige que todos os nós de login no cluster sejam interrompidos.
-
Para remover um pool, você deve interromper todos os nós de login no cluster. (Você pode interromper os nós de login no cluster definindo a contagem de cada pool igual a 0). Depois que os nós de login do cluster forem interrompidos, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.
nota
Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.11.0.
- Política de atualização: os nós de login no pool devem ser interrompidos para que essa configuração seja alterada para uma atualização.
-
Você não pode alterar essas configurações enquanto os nós de login no pool estiverem em uso. Ou você deve reverter a alteração ou interromper os nós de login do pool. (Você pode interromper os nós de login no pool definindo a contagem do pool igual a 0). Depois que os nós de login do pool forem interrompidos, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.
nota
Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.11.0.
- Política de atualização: essa configuração pode ser alterada durante uma atualização.
-
Depois de alterar essa configuração, o cluster pode ser atualizado usando o pcluster update-cluster.
- Política de atualização: se essa configuração for alterada, a atualização não será permitida.
-
Depois de alterar essa configuração, o cluster não poderá ser atualizado. Você deve reverter as configurações do cluster original e criar um novo cluster com as configurações atualizadas. Você pode excluir o cluster original em uma data posterior. Use pcluster create-cluster para criar um novo cluster. Use pcluster delete-cluster para excluir o cluster original.
- Política de atualização: essa configuração não é analisada durante uma atualização.
-
Essas configurações podem ser alteradas, e o cluster pode ser atualizado usando o pcluster update-cluster.
- Política de atualização: a frota de computação deve ser interrompida para que essa configuração seja alterada para uma atualização.
-
Essas configurações não podem ser alteradas enquanto a frota de computação existir. A alteração deve ser revertida ou a frota de computação deve ser interrompida (usando pcluster update-compute-fleet). Depois que a frota computacional for interrompida, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações. Por exemplo, se você estiver usando um Slurm agendador com SlurmQueues/ComputeResources/- Name/MinCount> 0, uma frota de computação é iniciada.
- Política de atualização: a frota de computação e os nós de login devem ser interrompidos para que essa configuração seja alterada para uma atualização.
-
Essas configurações não podem ser alteradas enquanto a frota computacional existir ou se os nós de login estiverem em uso. A alteração deve ser revertida ou a frota de computação e os nós de login devem ser interrompidos (o uso da frota de computação pode ser interrompido). pcluster update-compute-fleet Depois que a frota de computação e os nós de login forem interrompidos, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.
- Política de atualização: essa configuração não pode ser diminuída durante uma atualização.
-
Essas configurações podem ser alteradas, mas não podem ser diminuídas. Se essas configurações tiverem que ser diminuídas, você deve reverter as configurações do cluster original e criar um novo cluster com as configurações atualizadas. Você pode excluir o cluster original em uma data posterior. Use pcluster create-cluster para criar um novo cluster. Use pcluster delete-cluster para excluir o cluster original.
- Política de atualização: se essa configuração for alterada, a atualização não será permitida. Se você forçar a atualização, o novo valor será ignorado e o valor antigo será usado.
-
Depois de alterar essa configuração, o cluster não poderá ser atualizado. Você deve reverter as configurações do cluster original e criar um novo cluster com as configurações atualizadas. Você pode excluir o cluster original em uma data posterior. Use pcluster create-cluster para criar um novo cluster. Use pcluster delete-cluster para excluir o cluster original.
- Política de atualização: a frota de computação deve ser interrompida ou QueueUpdateStrategy para que essa configuração seja alterada para uma atualização.
-
Essas configurações podem ser alteradas. A frota de computação deve ser interrompida (usando pcluster update-compute-fleet) ou QueueUpdateStrategy deve ser definido. Depois que a frota de computação for interrompida ou QueueUpdateStrategy for definido, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.
nota
Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.2.0.
- Política de atualização: para essa configuração de valores de lista, um novo valor pode ser adicionado durante uma atualização ou a frota de computação deve ser interrompida ao remover um valor existente.
-
Um novo valor para essas configurações pode ser adicionado durante uma atualização. Depois de adicionar um novo valor à lista, o cluster pode ser atualizado usando (pcluster update-cluster).
Para remover um valor existente da lista, a frota de computação deve ser interrompida (usando pcluster update-compute-fleet).
Por exemplo, se você estiver usando um Slurm Com o agendador e adicionando um novo tipo de instância a Instances/ InstanceType, você pode atualizar o cluster sem interromper a frota computacional. Para remover um tipo de instância existente de Instances/ InstanceType, a frota computacional deve ser interrompida primeiro (usando pcluster). update-compute-fleet
nota
Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.2.0.
- Política de atualização: reduzir o tamanho de uma fila exige que a frota de computação seja interrompida ou QueueUpdateStrategydefinida TERMINATE para que essa configuração seja alterada para uma atualização.
-
Essas configurações podem ser alteradas, mas se a alteração reduzir o tamanho da fila, a frota computacional deve ser interrompida (usando pcluster update-compute-fleet) ou definida QueueUpdateStrategycomo. TERMINATE Depois que a frota computacional for interrompida ou QueueUpdateStrategyconfigurada paraTERMINATE, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.
O TERMINATE conjunto, ao redimensionar a capacidade do cluster, encerrará apenas os nós do final da lista de nós e deixará intocados todos os outros nós da mesma partição.
Por exemplo, se a capacidade inicial do cluster for
MinCount = 5
eMaxCount = 10
, os nós serãost-[1-5]; dy-[1-5]
. Ao redimensionar o cluster paraMinCount = 3
eMaxCount = 5
, a nova capacidade do cluster será composta pelos nósst-[1-3]; dy-[1-2]
, que não serão alterados durante a atualização. Somente osst-[4-5]; dy-[3-5]
nós serão encerrados durante a atualização.As alterações a seguir são suportadas e não exigem que a frota de computação seja interrompida nem QueueUpdateStrategyconfigurada paraTERMINATE:
-
Um novo SlurmQueueé adicionado
-
Um novo ComputeResourceé adicionado
-
MaxCounté aumentado
-
MinCounté aumentado e MaxCounté aumentado em pelo menos a mesma quantidade
Observação: essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.9.0.
-
- Política de atualização: para essa configuração de valores de lista, a frota de computação deve ser interrompida ou QueueUpdateStrategy deve ser configurada para agregar um novo valor; a frota de computação deve ser interrompida ao remover um valor existente.
-
Um novo valor para essas configurações pode ser adicionado durante uma atualização. A frota de computação deve ser interrompida (usando pcluster update-compute-fleet) ou QueueUpdateStrategy deve ser definido. Depois que a frota de computação for interrompida ou QueueUpdateStrategy for definido, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.
Para remover um valor existente da lista, a frota de computação deve ser interrompida (usando pcluster update-compute-fleet).
nota
Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.3.0.
- Política de atualização: todos os nós de computação devem ser interrompidos para a exclusão de um grupo de posicionamento gerenciado. A frota de computação deve ser interrompida ou QueueUpdateStrategy deve ser configurada para que essa configuração seja alterada para uma atualização.
-
A frota de computação deve ser interrompida (usando pcluster update-compute-fleet) para remover um grupo de posicionamento gerenciado. Se você executar uma atualização de cluster para remover um grupo de posicionamento gerenciado antes de interromper a frota de computação, uma mensagem de configuração inválida será retornada e a atualização não prosseguirá. A interrupção da frota de computação garante que nenhuma instância esteja em execução.
Exemplos do pcluster update-cluster
Essas configurações podem ser alteradas, mas se a alteração reduzir o tamanho da fila, a frota computacional deve ser interrompida (usando pcluster update-compute-fleet) ou definida QueueUpdateStrategycomo. TERMINATE Depois que a frota computacional for interrompida ou QueueUpdateStrategyconfigurada paraTERMINATE, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.
-
Este exemplo demonstra uma atualização com algumas alterações permitidas e a atualização é iniciada diretamente.
$
pcluster update-cluster --cluster-name
cluster_name
--cluster-config ~/.parallelcluster/test_cluster --region us-east-1{ "cluster": { "clusterName":
cluster_name
, "cloudformationStackStatus": "UPDATE_IN_PROGRESS", "cloudformationStackArn":stack_arn
, "region": "us-east-1", "version": "3.7.0", "clusterStatus": "UPDATE_IN_PROGRESS" }, "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] } -
Este exemplo demonstra uma atualização de simulação com algumas alterações permitidas. A simulação é útil para relatar o conjunto de alterações sem iniciar a atualização.
$
pcluster update-cluster --cluster-name
cluster_name
--cluster-config ~/.parallelcluster/test_cluster --region us-east-1 --dryrun true{ "message": "Request would have succeeded, but DryRun flag is set.", "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
-
Este exemplo demonstra uma atualização com algumas alterações que bloqueiam a atualização.
$
pcluster update-cluster --cluster-name
cluster_name
--cluster-config ~/.parallelcluster/test_cluster --region us-east-1{ "message": "Update failure", "updateValidationErrors": [ { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "message": "Update actions are not currently supported for the 'KeyName' parameter. Restore 'KeyName' value to 'jenkinsjun'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "message": "All compute nodes must be stopped. Stop the compute fleet with the pcluster update-compute-fleet command", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "message": "Update actions are not currently supported for the 'MountDir' parameter. Restore 'MountDir' value to '/shared'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "/shared" } ], "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] }, { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "currentValue": "/shared" } ] }