As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Uma EC2 instância AWS PCS é encerrada e substituída após a reinicialização
Visão geral do problema
Depois que uma EC2 instância em um grupo de nós de computação é reinicializada, a instância é encerrada e substituída AWS PCS automaticamente.
Por que isso acontece
AWS PCSnão suporta reinicializações de instâncias. Se uma EC2 instância for reinicializada, AWS PCS considerará a instância não íntegra e a substituirá. Se você encerra e substitui AWS PCS continuamente suas instâncias, pode ser porque algo reinicia suas instâncias após a inicialização. Alguns exemplos incluem reinicializações por automação na EC2 instância (como reinicialização automática após aplicação de patches), automação externa à EC2 instância (como um aplicativo de gerenciamento de rede), outro AWS serviço (como AWS Systems Manager) ou reinicialização manual por uma pessoa.
O que fazer
Você pode verificar seus slurmd
registros slurmctld
ou para ver se sua instância foi reinicializada. Para ter mais informações, consulte AWS PCSregistros do agendador e Monitoramento de AWS PCS instâncias usando a Amazon CloudWatch. O exemplo de entrada de slurmctld
registro a seguir indica que a instância foi reinicializada:
[2024-09-12T06:42:50.393+00:00] validate_node_specs: Node Login-1 unexpectedly rebooted boot_time=1726123354 last response=1726123285
Reinicializando devido à aplicação de patches
Geralmente, é necessária uma reinicialização após a aplicação dos patches. Não aplique patches diretamente a uma EC2 instância que faz parte de um grupo de nós de AWS PCS computação. Se precisar corrigir suas EC2 instâncias, você deve aplicar seus patches a uma Amazon Machine Image (AMI) atualizada e atualizar seus grupos de nós de computação para usar a atualizaçãoAMI. EC2As novas instâncias AWS PCS lançadas para esses grupos de nós de computação usarão a versão atualizada (corrigida). AMI Para obter mais informações, consulte Imagens personalizadas da Amazon Machine (AMIs) para AWS PCS.