다중 대기열 모드 - AWS ParallelCluster

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

다중 대기열 모드

AWS ParallelCluster 버전 2.9.0에는 여러 대기열 모드가 도입되었습니다. schedulerslurm로 설정하고 queue_settings 설정을 정의하면 다중 대기열 모드가 지원됩니다. 이 모드를 사용하면 컴퓨팅 노드에서 다양한 인스턴스 유형이 공존할 수 있습니다. 다양한 인스턴스 유형을 포함하는 컴퓨팅 리소스는 필요에 따라 스케일 업 또는 스케일 다운할 수 있습니다. 대기열 모드에서는 최대 5개의 대기열이 지원되며 각 [queue] 섹션은 최대 3개의 [compute_resource] 섹션을 참조할 수 있습니다. 이러한 각 [queue] 섹션은 의 파티션입니다.Slurm Workload Manager. 자세한 내용은 Slurm 다중 대기열 모드에 대한 가이드 및 섹션을 참조하세요다중 대기열 모드 자습서.

대기열의 각 [compute_resource] 섹션은 서로 다른 인스턴스 유형을 가져야 하며, 각 [compute_resource]는 다시 정적 노드와 동적 노드로 구분됩니다. 각 [compute_resource]의 정적 노드는 1부터 min_count의 값까지 번호가 매겨집니다. 각 [compute_resource]의 동적 노드는 1부터 (max_count-min_count)까지 번호가 매겨집니다. 예를 들어, min_count가 2이고 max_count가 10인 경우 [compute_resource]의 동적 노드는 1에서 8까지 번호가 매겨집니다. 언제든지 [compute_resource]에는 0과 동적 노드의 최대 수 사이의 번호가 있을 수 있습니다.

컴퓨팅 플릿으로 시작되는 인스턴스는 동적으로 할당됩니다. 이를 관리하는 데 도움이 되도록 각 노드에 대해 호스트 이름이 생성됩니다. 호스트 이름 형식은 다음과 같습니다.

$HOSTNAME=$QUEUE-$STATDYN-$INSTANCE_TYPE-$NODENUM

  • $QUEUE은 대기열의 이름입니다. 예를 들어 섹션이 시작되면 [queue queue-name]$QUEUE”는 “queue-name”.

  • $STATDYN은 정적 노드에는 st 또는 동적 노드에는 dy입니다.

  • $INSTANCE_TYPEinstance_type 설정에 있는 [compute_resource]의 인스턴스 유형입니다.

  • $NODENUM은 노드의 번호입니다. $NODENUM은 정적 노드의 경우 1과 min_count의 값 사이, 동적 노드의 경우 1과 (max_count-min_count) 사이입니다.

호스트 이름과 정규화된 도메인 이름(FQDN)은 모두 Amazon Route 53 호스팅 영역을 사용하여 생성됩니다. FQDN 는 이며$HOSTNAME.$CLUSTERNAME.pcluster, 여기서 $CLUSTERNAME는 클러스터에 사용되는 [cluster] 섹션의 이름입니다.

구성을 대기열 모드로 변환하려면 pcluster-config convert 명령을 사용합니다. 이름이 [queue compute]인 단일 [queue] 섹션으로 업데이트된 구성을 작성합니다. 해당 대기열에는 이름이 [compute_resource default]인 단일 [compute_resource] 섹션이이 있습니다. [queue compute][compute_resource default]는 지정된 [cluster] 섹션에서 마이그레이션된 설정이 있습니다.