O que é serviço de computação AWS paralela? - AWS PCS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

O que é serviço de computação AWS paralela?

AWS O Parallel Computing Service (AWS PCS) é um serviço gerenciado que facilita a execução e a escalabilidade de cargas de trabalho de computação de alto desempenho (HPC) e a criação de modelos científicos e de engenharia AWS usando o Slurm. Use AWS PCS para criar clusters de computação que integram a melhor AWS computação, armazenamento, rede e visualização da categoria. Execute simulações ou crie modelos científicos e de engenharia. Simplifique e simplifique suas operações de cluster usando recursos integrados de gerenciamento e observabilidade. Capacite seus usuários a se concentrarem em pesquisa e inovação, permitindo que eles executem seus aplicativos e trabalhos em um ambiente familiar.

Principais conceitos

Um cluster em AWS PCS tem 1 ou mais filas, associadas a pelo menos 1 grupo de nós de computação. Os trabalhos são enviados para filas e executados em EC2 instâncias definidas por grupos de nós de computação. Você pode usar essas bases para implementar HPC arquiteturas sofisticadas.

Cluster

Um cluster é um recurso para gerenciar recursos e executar cargas de trabalho. Um cluster é um AWS PCS recurso que define um conjunto de configurações de computação, rede, armazenamento, identidade e agendador de tarefas. Você cria um cluster especificando qual agendador de trabalhos deseja usar (Slurm atualmente), qual configuração de agendador deseja, qual controlador de serviço deseja gerenciar o cluster e em qual VPC deseja que os recursos do cluster sejam lançados. O agendador aceita e agenda trabalhos e também inicia os nós de computação (EC2instâncias) que processam esses trabalhos.

Grupo de nós de computação

Um grupo de nós de computação é uma coleção de nós de computação AWS PCS usados para executar trabalhos ou fornecer acesso interativo a um cluster. Ao definir um grupo de nós de computação, você especifica características comuns, como tipos de EC2 instância da Amazon, contagem mínima e máxima de instâncias, VPC sub-redes de destino, Amazon Machine Image (AMI), opção de compra e configuração de lançamento personalizada. AWS PCSusa essas configurações para iniciar, gerenciar e encerrar com eficiência os nós de computação em um grupo de nós de computação.

Fila

Quando quiser executar um trabalho em um cluster específico, você o envia para uma fila específica (também chamada de partição). O trabalho permanece na fila até que seja AWS PCS programado para execução em um grupo de nós de computação. Você associa um ou mais grupos de nós de computação a cada fila. É necessária uma fila para agendar e executar trabalhos nos recursos do grupo de nós de computação subjacentes usando várias políticas de agendamento oferecidas pelo agendador de trabalhos. Os usuários não enviam trabalhos diretamente para um nó de computação ou grupo de nós de computação.

Administrador de sistema

Um administrador do sistema implanta, mantém e opera um cluster. Eles podem acessar AWS PCS por meio do AWS Management Console AWS PCSAPI, AWS SDK e. Eles têm acesso a clusters específicos por meio de SSH ou AWS Systems Manager, onde podem executar tarefas administrativas, executar trabalhos, gerenciar dados e realizar outras atividades baseadas em shell. Para obter mais informações, consulte a Documentação do AWS Systems Manager.

Usuário final

Um usuário final não tem a day-to-day responsabilidade de implantar ou operar um cluster. Eles usam uma interface de terminal (comoSSH) para acessar recursos do cluster, executar trabalhos, gerenciar dados e realizar outras atividades baseadas em shell.