기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
AWS PCS에서 컴퓨팅 노드 그룹 생성
이 주제에서는 사용 가능한 옵션에 대한 개요를 제공하고 AWS 병렬 컴퓨팅 서비스(AWS PCS)에서 컴퓨팅 노드 그룹을 생성할 때 고려해야 할 사항에 대해 설명합니다. AWS PCS에서 컴퓨팅 노드 그룹을 처음 생성하는 경우의 자습서를 따르는 것이 좋습니다AWS 병렬 컴퓨팅 서비스 시작하기. 자습서는 가능한 모든 사용 가능한 옵션과 시스템 아키텍처로 확장하지 않고도 작동 중인 HPC 시스템을 생성하는 데 도움이 될 수 있습니다.
사전 조건
AWS PCS에서 컴퓨팅 노드 그룹 생성
AWS Management Console 또는를 사용하여 컴퓨팅 노드 그룹을 생성할 수 있습니다 AWS CLI.
- AWS Management Console
-
콘솔을 사용하여 컴퓨팅 노드 그룹을 생성하려면
-
AWS PCS 콘솔을 엽니다.
-
컴퓨팅 노드 그룹을 생성할 클러스터를 선택합니다. 컴퓨팅 노드 그룹으로 이동하여 생성을 선택합니다.
-
노드 그룹 계산 설정 섹션에서 노드 그룹의 이름을 입력합니다. 이름에는 대소문자를 구분하는 영숫자와 하이픈만 사용할 수 있습니다. 알파벳 문자로 시작해야 하며 25자를 초과할 수 없습니다. 이름은 클러스터 내에서 고유해야 합니다.
-
컴퓨팅 구성에서 다음 값을 입력하거나 선택합니다.
-
EC2 시작 템플릿 -이 노드 그룹에 사용할 사용자 지정 시작 템플릿을 선택합니다. 시작 템플릿을 사용하여 서브넷, 보안 그룹, 모니터링 구성 및 인스턴스 수준 스토리지와 같은 네트워크 설정을 사용자 지정할 수 있습니다. 시작 템플릿이 준비되지 않은 경우 Amazon EC2 시작 템플릿을 AWS PCS와 함께 사용을 참조하여 템플릿을 생성하는 방법을 알아봅니다.
AWS PCS는 각 컴퓨팅 노드 그룹에 대한 관리형 시작 템플릿을 생성합니다. 이름은 입니다pcs-identifier
-do-not-delete
. 컴퓨팅 노드 그룹을 생성하거나 업데이트할 때 이러한 항목을 선택하지 마세요. 그렇지 않으면 노드 그룹이 제대로 작동하지 않습니다.
-
EC2 시작 템플릿 버전 - 사용자 지정 시작 템플릿의 버전을 선택해야 합니다. 나중에 버전을 변경하는 경우 시작 템플릿의 변경 사항을 감지하도록 컴퓨팅 노드 그룹을 업데이트해야 합니다. 자세한 내용은 AWS PCS컴퓨팅 노드 그룹 업데이트 단원을 참조하십시오.
-
AMI ID - 시작 템플릿에 AMI ID가 포함되어 있지 않거나 시작 템플릿의 값을 재정의하려면 여기에 AMI ID를 입력합니다. 노드 그룹에 사용되는 AMI는 AWS PCS와 호환되어야 합니다. 에서 제공하는 샘플 AMI를 선택할 수도 있습니다 AWS. 이 주제에 대한 자세한 내용은 섹션을 참조하세요Amazon Machine Images(AMIs) for AWS PCS.
-
IAM 인스턴스 프로파일 - 노드 그룹의 인스턴스 프로파일을 선택합니다. 인스턴스 프로필은 인스턴스에 리소스 및 서비스에 안전하게 액세스할 AWS 수 있는 권한을 부여합니다. 준비가 되어 있지 않은 경우 AWS 병렬 컴퓨팅 서비스를 위한 IAM 인스턴스 프로파일을 참조하여 생성 방법을 알아봅니다.
-
서브넷 - VPC에서 AWS PCS 클러스터가 배포되는 서브넷을 하나 이상 선택합니다. 여러 서브넷을 선택하면 노드 간에 EFA 통신을 사용할 수 없으며 서로 다른 서브넷의 노드 간 통신이 지연 시간을 늘릴 수 있습니다. 여기에서 지정하는 서브넷이 EC2 시작 템플릿에서 정의한 서브넷과 일치하는지 확인합니다.
-
인스턴스 - 노드 그룹의 조정 요청을 이행하려면 인스턴스 유형을 하나 이상 선택합니다. 모든 인스턴스 유형은 동일한 프로세서 아키텍처(x86_64 또는 arm64)와 vCPUs 수를 가져야 합니다. 인스턴스에 GPUs가 있는 경우 모든 인스턴스 유형에 동일한 개수의 GPUs가 있어야 합니다.
-
크기 조정 구성 - 노드 그룹의 최소 및 최대 인스턴스 수를 지정합니다. 실행 중인 노드 수가 고정된 정적 구성 또는 최대 노드 수까지 실행할 수 있는 동적 구성을 정의할 수 있습니다. 정적 구성의 경우 최소값과 최대값을 0보다 큰 숫자로 동일하게 설정합니다. 동적 구성의 경우 최소 인스턴스를 0으로 설정하고 최대 인스턴스를 0보다 큰 숫자로 설정합니다. AWS PCS는 정적 인스턴스와 동적 인스턴스가 혼합된 컴퓨팅 노드 그룹을 지원하지 않습니다.
-
(선택 사항) 추가 설정에서 다음을 지정합니다.
-
구매 옵션 - 스팟 인스턴스와 온디맨드 인스턴스 중에서 선택합니다.
-
할당 전략 - 스팟 구매 옵션을 선택한 경우 노드 그룹에서 인스턴스를 시작할 때 스팟 용량 풀을 선택하는 방법을 지정할 수 있습니다. 자세한 내용은 Amazon Elastic Compute Cloud 사용 설명서의 스팟 인스턴스에 대한 할당 전략을 참조하세요. 온디맨드 구매 옵션을 선택한 경우이 옵션은 적용되지 않습니다.
-
(선택 사항)의 Slurm 사용자 지정 설정 섹션에서 다음 값을 제공합니다.
-
가중치 -이 값은 예약 목적으로 그룹 내 노드의 우선 순위를 설정합니다. 가중치가 낮은 노드는 우선 순위가 높고 단위는 임의적입니다. 자세한 내용은 https://slurm.schedmd.com/slurm.conf.html#OPT_Weight Slurm .
-
실제 메모리 -이 값은 노드 그룹의 노드에서 실제 메모리의 크기(GB)를 설정합니다. 클러스터의 CR_CPU_Memory
옵션과 함께 사용하기 위한 것입니다.Slurm AWS PCS의 구성. 자세한 내용은 RealMemory Slurm .
-
(선택 사항) 태그에서 컴퓨팅 노드 그룹에 태그를 추가합니다.
-
컴퓨팅 노드 그룹 생성을 선택합니다. 상태 필드는 AWS PCS가 노드 그룹을 프로비저닝하는 Creating
동안 표시됩니다. 몇 분 정도 걸릴 수 있습니다.
- AWS CLI
-
를 사용하여 컴퓨팅 노드 그룹을 생성하려면 AWS CLI
다음 명령을 사용하여 대기열을 생성합니다. 명령을 실행하기 전에 다음과 같은 바꾸기를 합니다.
-
Replace region
의 ID를 사용하여와 같은에서 클러스터 AWS 리전 를 생성합니다us-east-1
.
-
Replace my-cluster
clusterId
클러스터의 이름 또는를 사용합니다.
-
Replace my-node-group
컴퓨팅 노드 그룹의 이름을 사용합니다. 이름에는 영숫자(대소문자 구분)와 하이픈만 사용할 수 있습니다. 알파벳 문자로 시작해야 하며 25자를 초과할 수 없습니다. 이름은 클러스터 내에서 고유해야 합니다.
-
Replace subnet-ExampleID1
클러스터 IDs에서 하나 이상의 서브넷 VPC를 사용합니다.
-
Replace lt-ExampleID1
사용자 지정 시작 템플릿의 ID를 사용합니다. 준비가 되지 않은 경우 Amazon EC2 시작 템플릿을 AWS PCS와 함께 사용을 참조하여 생성 방법을 알아봅니다.
AWS PCS는 각 컴퓨팅 노드 그룹에 대한 관리형 시작 템플릿을 생성합니다. 이름은 입니다pcs-identifier
-do-not-delete
. 컴퓨팅 노드 그룹을 생성하거나 업데이트할 때 이러한 항목을 선택하지 마세요. 그렇지 않으면 노드 그룹이 제대로 작동하지 않습니다.
-
Replace launch-template-version
특정 시작 템플릿 버전을 사용합니다. AWS PCS는 노드 그룹을 시작 템플릿의 특정 버전과 연결합니다.
-
Replace arn:InstanceProfile
ARN 인스턴스 프로필의 IAM를 사용합니다. 준비가 되어 있지 않은 경우의 지침을 참조Amazon EC2 시작 템플릿을 AWS PCS와 함께 사용하세요.
-
Replace min-instances
and max-instances
정수 값 포함. 실행 중인 노드 수가 고정된 정적 구성 또는 최대 노드 수까지 실행할 수 있는 동적 구성을 정의할 수 있습니다. 정적 구성의 경우 최소값과 최대값을 0보다 큰 숫자로 동일하게 설정합니다. 동적 구성의 경우 최소 인스턴스를 0으로 설정하고 최대 인스턴스를 0보다 큰 숫자로 설정합니다. AWS PCS는 정적 인스턴스와 동적 인스턴스가 혼합된 컴퓨팅 노드 그룹을 지원하지 않습니다.
-
Replace t3.large
다른 인스턴스 유형으로. instanceType
설정 목록을 지정하여 인스턴스 유형을 더 추가할 수 있습니다. 예: --instance-configs instanceType=c6i.16xlarge,instanceType=c6a.16xlarge
. 모든 인스턴스 유형은 동일한 프로세서 아키텍처(x86_64 또는 arm64)와 vCPUs 수를 가져야 합니다. 인스턴스에 GPUs가 있는 경우 모든 인스턴스 유형은 동일한 개수의 GPUs를 가져야 합니다.
aws pcs create-compute-node-group --region region
\
--cluster-identifier my-cluster
\
--compute-node-group-name my-node-group
\
--subnet-ids subnet-ExampleID1
\
--custom-launch-template id=lt-ExampleID1
,version='launch-template-version
' \
--iam-instance-profile arn=arn:InstanceProfile
\
--scaling-config minInstanceCount=min-instances
,maxInstanceCount=max-instance
\
--instance-configs instanceType=t3.large
create-compute-node-group
명령에 추가할 수 있는 몇 가지 선택적 구성 설정이 있습니다.
-
사용자 지정 시작 템플릿에 AMI에 대한 참조가 포함되어 있지 않은--amiId
지 또는 해당 값을 재정의하려는지 지정할 수 있습니다. 노드 그룹에 사용되는 AMI는 AWS PCS와 호환되어야 합니다. 에서 제공하는 샘플 AMI를 선택할 수도 있습니다 AWS. 이 주제에 대한 자세한 내용은 섹션을 참조하세요Amazon Machine Images(AMIs) for AWS PCS.
-
를 사용하여 온디맨드(ONDEMAND
) 인스턴스와 스팟(SPOT
) 인스턴스 중에서 선택할 수 있습니다--purchase-option
. 온디맨드가 기본값입니다. 스팟 인스턴스를 선택하는 경우 --allocation-strategy
를 사용하여 노드 그룹에서 인스턴스를 시작할 때 AWS PCS가 스팟 용량 풀을 선택하는 방법을 정의할 수도 있습니다. 자세한 내용은 Amazon Elastic Compute Cloud 사용 설명서의 스팟 인스턴스에 대한 할당 전략을 참조하세요.
-
를 제공할 수 있습니다.Slurm 를 사용하는 노드 그룹의 노드에 대한 구성 옵션입니다--slurm-configuration
. 가중치(일정 우선순위)와 실제 메모리를 설정할 수 있습니다. 가중치가 낮은 노드는 우선 순위가 높고 단위는 임의적입니다. 자세한 내용은의 가중치를 참조하세요.Slurm . 실제 메모리는 노드 그룹의 노드에서 실제 메모리의 크기(GB)를 설정합니다. 이는의 클러스터 in AWS PCS CR_CPU_Memory
옵션과 함께 사용하기 위한 것입니다.Slurm 구성. 자세한 내용은 RealMemory Slurm .
컴퓨팅 노드 그룹을 생성하는 데 몇 분 정도 걸릴 수 있습니다.
다음 명령을 사용하여 노드 그룹의 상태를 쿼리할 수 있습니다. 상태가에 도달할 때까지 노드 그룹을 대기열과 연결할 수 없습니다ACTIVE
.
aws pcs get-compute-node-group --region region
\
--cluster-identifier my-cluster
\
--compute-node-group-identifier my-node-group