Qu'est-ce que le service de calcul AWS parallèle ? - AWS PCS

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Qu'est-ce que le service de calcul AWS parallèle ?

AWS Parallel Computing Service (AWS PCS) est un service géré qui facilite l'exécution et le dimensionnement des charges de travail de calcul haute performance (HPC), ainsi que la création de modèles scientifiques et d'ingénierie basés sur AWS l'utilisation de Slurm. AWS PCSÀ utiliser pour créer des clusters de calcul qui intègrent les meilleurs systèmes de AWS calcul, de stockage, de mise en réseau et de visualisation. Exécutez des simulations ou créez des modèles scientifiques et techniques. Rationalisez et simplifiez les opérations de votre cluster à l'aide de fonctionnalités de gestion et d'observabilité intégrées. Donnez à vos utilisateurs les moyens de se concentrer sur la recherche et l'innovation en leur permettant d'exécuter leurs applications et leurs tâches dans un environnement familier.

Concepts clés

Un cluster AWS PCS contient une ou plusieurs files d'attente associées à au moins un groupe de nœuds de calcul. Les tâches sont soumises à des files d'attente et exécutées sur des EC2 instances définies par des groupes de nœuds de calcul. Vous pouvez utiliser ces bases pour implémenter des HPC architectures sophistiquées.

Cluster

Un cluster est une ressource permettant de gérer des ressources et d'exécuter des charges de travail. Un cluster est une AWS PCS ressource qui définit un ensemble de configurations de calcul, de mise en réseau, de stockage, d'identité et de planificateur de tâches. Vous créez un cluster en spécifiant le planificateur de tâches que vous souhaitez utiliser (Slurm actuellement), la configuration du planificateur que vous souhaitez, le contrôleur de service que vous souhaitez gérer le cluster et dans lequel VPC vous souhaitez que les ressources du cluster soient lancées. Le planificateur accepte et planifie les tâches, et lance également les nœuds de calcul (EC2instances) qui traitent ces tâches.

Groupe de nœuds de calcul

Un groupe de nœuds de calcul est un ensemble de nœuds de calcul AWS PCS utilisé pour exécuter des tâches ou fournir un accès interactif à un cluster. Lorsque vous définissez un groupe de nœuds de calcul, vous spécifiez des caractéristiques communes telles que les types d'EC2instances Amazon, le nombre d'instances minimal et maximal, les VPC sous-réseaux cibles, Amazon Machine Image (AMI), l'option d'achat et la configuration de lancement personnalisée. AWS PCSutilise ces paramètres pour lancer, gérer et arrêter efficacement les nœuds de calcul d'un groupe de nœuds de calcul.

File d’attente

Lorsque vous souhaitez exécuter une tâche sur un cluster spécifique, vous la soumettez à une file d'attente spécifique (parfois appelée partition). La tâche reste dans la file d'attente jusqu'à ce AWS PCS qu'elle soit planifiée pour s'exécuter sur un groupe de nœuds de calcul. Vous associez un ou plusieurs groupes de nœuds de calcul à chaque file d'attente. Une file d'attente est requise pour planifier et exécuter des tâches sur les ressources du groupe de nœuds de calcul sous-jacents à l'aide des différentes politiques de planification proposées par le planificateur de tâches. Les utilisateurs ne soumettent pas de tâches directement à un nœud de calcul ou à un groupe de nœuds de calcul.

Administrateur système

Un administrateur système déploie, gère et exploite un cluster. Ils peuvent y accéder AWS PCS via le AWS Management Console AWS PCSAPI, et AWS SDK. Ils ont accès à des clusters spécifiques via SSH ou AWS Systems Manager, où ils peuvent exécuter des tâches administratives, exécuter des tâches, gérer des données et effectuer d'autres activités basées sur le shell. Pour plus d'informations, consultez la documentation AWS Systems Manager.

Utilisateur final

L'utilisateur final n'a pas day-to-day la responsabilité de déployer ou d'exploiter un cluster. Ils utilisent une interface de terminal (telle queSSH) pour accéder aux ressources du cluster, exécuter des tâches, gérer les données et effectuer d'autres activités basées sur le shell.