Usar o pcluster update-cluster - AWS ParallelCluster

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usar o pcluster update-cluster

Na AWS ParallelCluster versão 3.x, pcluster update-cluster analisa as configurações usadas para criar o cluster atual e as configurações no arquivo de configuração em busca de problemas. Se algum problema for descoberto, ele será relatado e as etapas a serem seguidas para corrigi-los serão exibidas. Por exemplo, se a InstanceType de computação for alterada, a frota de computação deverá ser interrompida antes que uma atualização possa continuar. Esse problema é relatado quando é descoberto. Se nenhum problema de bloqueio for descoberto, o processo de atualização será iniciado e as alterações serão relatadas.

Você pode usar o pcluster update-cluster --dryrun option para ver as alterações antes de serem executadas. Para obter mais informações, consulte Exemplos do pcluster update-cluster.

Para obter ajuda de solução de problemas, consulte AWS ParallelCluster solução de problemas.

Política de atualização: definições

Política de atualização: os nós de login no cluster devem ser interrompidos para que essa configuração seja alterada para uma atualização.

Você não pode alterar essas configurações enquanto os nós de login no cluster estão em uso. Ou você deve reverter a alteração ou interromper os nós de login do cluster. (Você pode interromper os nós de login no cluster definindo a contagem de cada pool igual a 0). Depois que os nós de login do cluster forem interrompidos, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.

nota

Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.7.0.

Política de atualização: grupos de nós de login podem ser adicionados, mas a remoção de um pool exige que todos os nós de login no cluster sejam interrompidos.

Para remover um pool, você deve interromper todos os nós de login no cluster. (Você pode interromper os nós de login no cluster definindo a contagem de cada pool igual a 0). Depois que os nós de login do cluster forem interrompidos, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.

nota

Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.11.0.

Política de atualização: os nós de login no pool devem ser interrompidos para que essa configuração seja alterada para uma atualização.

Você não pode alterar essas configurações enquanto os nós de login no pool estiverem em uso. Ou você deve reverter a alteração ou interromper os nós de login do pool. (Você pode interromper os nós de login no pool definindo a contagem do pool igual a 0). Depois que os nós de login do pool forem interrompidos, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.

nota

Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.11.0.

Política de atualização: essa configuração pode ser alterada durante uma atualização.

Depois de alterar essa configuração, o cluster pode ser atualizado usando o pcluster update-cluster.

Política de atualização: se essa configuração for alterada, a atualização não será permitida.

Depois de alterar essa configuração, o cluster não poderá ser atualizado. Você deve reverter as configurações do cluster original e criar um novo cluster com as configurações atualizadas. Você pode excluir o cluster original em uma data posterior. Use pcluster create-cluster para criar um novo cluster. Use pcluster delete-cluster para excluir o cluster original.

Política de atualização: essa configuração não é analisada durante uma atualização.

Essas configurações podem ser alteradas, e o cluster pode ser atualizado usando o pcluster update-cluster.

Política de atualização: a frota de computação deve ser interrompida para que essa configuração seja alterada para uma atualização.

Essas configurações não podem ser alteradas enquanto a frota de computação existir. A alteração deve ser revertida ou a frota de computação deve ser interrompida (usando pcluster update-compute-fleet). Depois que a frota computacional for interrompida, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações. Por exemplo, se você estiver usando um Slurm agendador com SlurmQueues/ComputeResources/- Name/MinCount> 0, uma frota de computação é iniciada.

Política de atualização: a frota de computação e os nós de login devem ser interrompidos para que essa configuração seja alterada para uma atualização.

Essas configurações não podem ser alteradas enquanto a frota computacional existir ou se os nós de login estiverem em uso. A alteração deve ser revertida ou a frota de computação e os nós de login devem ser interrompidos (o uso da frota de computação pode ser interrompido). pcluster update-compute-fleet Depois que a frota de computação e os nós de login forem interrompidos, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.

Política de atualização: essa configuração não pode ser diminuída durante uma atualização.

Essas configurações podem ser alteradas, mas não podem ser diminuídas. Se essas configurações tiverem que ser diminuídas, você deve reverter as configurações do cluster original e criar um novo cluster com as configurações atualizadas. Você pode excluir o cluster original em uma data posterior. Use pcluster create-cluster para criar um novo cluster. Use pcluster delete-cluster para excluir o cluster original.

Política de atualização: se essa configuração for alterada, a atualização não será permitida. Se você forçar a atualização, o novo valor será ignorado e o valor antigo será usado.

Depois de alterar essa configuração, o cluster não poderá ser atualizado. Você deve reverter as configurações do cluster original e criar um novo cluster com as configurações atualizadas. Você pode excluir o cluster original em uma data posterior. Use pcluster create-cluster para criar um novo cluster. Use pcluster delete-cluster para excluir o cluster original.

Política de atualização: a frota de computação deve ser interrompida ou QueueUpdateStrategy para que essa configuração seja alterada para uma atualização.

Essas configurações podem ser alteradas. A frota de computação deve ser interrompida (usando pcluster update-compute-fleet) ou QueueUpdateStrategy deve ser definido. Depois que a frota de computação for interrompida ou QueueUpdateStrategy for definido, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.

nota

Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.2.0.

Política de atualização: para essa configuração de valores de lista, um novo valor pode ser adicionado durante uma atualização ou a frota de computação deve ser interrompida ao remover um valor existente.

Um novo valor para essas configurações pode ser adicionado durante uma atualização. Depois de adicionar um novo valor à lista, o cluster pode ser atualizado usando (pcluster update-cluster).

Para remover um valor existente da lista, a frota de computação deve ser interrompida (usando pcluster update-compute-fleet).

Por exemplo, se você estiver usando um Slurm Com o agendador e adicionando um novo tipo de instância a Instances/ InstanceType, você pode atualizar o cluster sem interromper a frota computacional. Para remover um tipo de instância existente de Instances/ InstanceType, a frota computacional deve ser interrompida primeiro (usando pcluster). update-compute-fleet

nota

Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.2.0.

Política de atualização: reduzir o tamanho de uma fila exige que a frota de computação seja interrompida ou QueueUpdateStrategydefinida TERMINATE para que essa configuração seja alterada para uma atualização.

Essas configurações podem ser alteradas, mas se a alteração reduzir o tamanho da fila, a frota computacional deve ser interrompida (usando pcluster update-compute-fleet) ou definida QueueUpdateStrategycomo. TERMINATE Depois que a frota computacional for interrompida ou QueueUpdateStrategyconfigurada paraTERMINATE, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.

O TERMINATE conjunto, ao redimensionar a capacidade do cluster, encerrará apenas os nós do final da lista de nós e deixará intocados todos os outros nós da mesma partição.

Por exemplo, se a capacidade inicial do cluster for MinCount = 5 eMaxCount = 10, os nós serãost-[1-5]; dy-[1-5]. Ao redimensionar o cluster para MinCount = 3 eMaxCount = 5, a nova capacidade do cluster será composta pelos nósst-[1-3]; dy-[1-2], que não serão alterados durante a atualização. Somente os st-[4-5]; dy-[3-5] nós serão encerrados durante a atualização.

As alterações a seguir são suportadas e não exigem que a frota de computação seja interrompida nem QueueUpdateStrategyconfigurada paraTERMINATE:

  • Um novo SlurmQueueé adicionado

  • Um novo ComputeResourceé adicionado

  • MaxCounté aumentado

  • MinCounté aumentado e MaxCounté aumentado em pelo menos a mesma quantidade

    Observação: essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.9.0.

Política de atualização: para essa configuração de valores de lista, a frota de computação deve ser interrompida ou QueueUpdateStrategy deve ser configurada para agregar um novo valor; a frota de computação deve ser interrompida ao remover um valor existente.

Um novo valor para essas configurações pode ser adicionado durante uma atualização. A frota de computação deve ser interrompida (usando pcluster update-compute-fleet) ou QueueUpdateStrategy deve ser definido. Depois que a frota de computação for interrompida ou QueueUpdateStrategy for definido, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.

Para remover um valor existente da lista, a frota de computação deve ser interrompida (usando pcluster update-compute-fleet).

nota

Essa política de atualização é suportada a partir da AWS ParallelCluster versão 3.3.0.

Política de atualização: todos os nós de computação devem ser interrompidos para a exclusão de um grupo de posicionamento gerenciado. A frota de computação deve ser interrompida ou QueueUpdateStrategy deve ser configurada para que essa configuração seja alterada para uma atualização.

A frota de computação deve ser interrompida (usando pcluster update-compute-fleet) para remover um grupo de posicionamento gerenciado. Se você executar uma atualização de cluster para remover um grupo de posicionamento gerenciado antes de interromper a frota de computação, uma mensagem de configuração inválida será retornada e a atualização não prosseguirá. A interrupção da frota de computação garante que nenhuma instância esteja em execução.

Exemplos do pcluster update-cluster

Essas configurações podem ser alteradas, mas se a alteração reduzir o tamanho da fila, a frota computacional deve ser interrompida (usando pcluster update-compute-fleet) ou definida QueueUpdateStrategycomo. TERMINATE Depois que a frota computacional for interrompida ou QueueUpdateStrategyconfigurada paraTERMINATE, você poderá atualizar o cluster (pcluster update-cluster) para ativar as alterações.

  • Este exemplo demonstra uma atualização com algumas alterações permitidas e a atualização é iniciada diretamente.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 { "cluster": { "clusterName": cluster_name, "cloudformationStackStatus": "UPDATE_IN_PROGRESS", "cloudformationStackArn": stack_arn, "region": "us-east-1", "version": "3.7.0", "clusterStatus": "UPDATE_IN_PROGRESS" }, "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
  • Este exemplo demonstra uma atualização de simulação com algumas alterações permitidas. A simulação é útil para relatar o conjunto de alterações sem iniciar a atualização.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 --dryrun true { "message": "Request would have succeeded, but DryRun flag is set.", "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] } ] }
  • Este exemplo demonstra uma atualização com algumas alterações que bloqueiam a atualização.

    $ pcluster update-cluster --cluster-name cluster_name --cluster-config ~/.parallelcluster/test_cluster --region us-east-1 { "message": "Update failure", "updateValidationErrors": [ { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "message": "Update actions are not currently supported for the 'KeyName' parameter. Restore 'KeyName' value to 'jenkinsjun'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "message": "All compute nodes must be stopped. Stop the compute fleet with the pcluster update-compute-fleet command", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "message": "Update actions are not currently supported for the 'MountDir' parameter. Restore 'MountDir' value to '/shared'. If you need this change, please consider creating a new cluster instead of updating the existing one.", "currentValue": "/shared" } ], "changeSet": [ { "parameter": "HeadNode.Networking.AdditionalSecurityGroups", "requestedValue": [ "sg-0cd61884c4ad11234" ], "currentValue": [ "sg-0cd61884c4ad16341" ] }, { "parameter": "HeadNode.Ssh.KeyName", "requestedValue": "mykey_2", "currentValue": "mykey_1" }, { "parameter": "Scheduling.SlurmQueues[queue1].ComputeResources[queue1-t2micro].InstanceType", "requestedValue": "c4.xlarge", "currentValue": "t2.micro" }, { "parameter": "SharedStorage[ebs1].MountDir", "requestedValue": "/my/very/very/long/shared_dir", "currentValue": "/shared" } ] }