기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
사용자 지정 AMIs for AWS PCS를 빌드하는 소프트웨어 설치 관리자
AWS 는 인스턴스에 AWS PCS 소프트웨어를 설치할 수 있는 다운로드 가능한 파일을 제공합니다.는 관련 버전의 Slurm 및 해당 종속 항목을 다운로드, 컴파일 및 설치할 수 있는 소프트웨어 AWS 도 제공합니다. 이 지침을 사용하여 AWS PCS와 함께 사용할 사용자 지정 AMIs를 빌드하거나 자체 방법을 사용할 수 있습니다.
AWS PCS 소프트웨어 설치 관리자
AWS PCS 소프트웨어 설치 관리자는 인스턴스 부트스트랩 프로세스 중에 AWS PCS와 함께 작동하도록 인스턴스를 구성합니다. AWS제공된 설치 관리자를 사용하여 사용자 지정 AMI에 AWS PCS 소프트웨어를 설치해야 합니다.
Slurm 설치 관리자
Slurm 설치 프로그램은 관련 버전의 Slurm 및 해당 종속 항목을 다운로드, 컴파일 및 설치합니다. Slurm 설치 관리자를 사용하여 사용자 지정 AMIs for AWS PCS를 구축할 수 있습니다. Slurm 설치 프로그램이 제공하는 소프트웨어 구성과 일치하는 경우 자체 메커니즘을 사용할 수도 있습니다.
AWS제공된 소프트웨어는 다음을 설치합니다.
-
요청된 메이저 및 유지 관리 버전의 Slurm
(현재 버전 23.11.10) - 라이선스 GPL 2 -
Slurm은 로
--sysconfdir
설정된를 사용하여 구축됩니다./etc/slurm
-
Slurm은 옵션
--enable-pam
및를 사용하여 구축됩니다.--without-munge
-
Slurm은 옵션을 사용하여 구축됩니다.
--sharedstatedir=/run/slurm/
-
Slurm은 PMIX 및 JWT 지원으로 구축됩니다.
-
Slurm은에 설치됩니다.
/opt/aws/pcs/schedulers/slurm-23.11
-
-
-
OpenPMIX는의 하위 디렉터리로 설치됩니다.
/opt/aws/pcs/scheduler/
-
-
libjwt
(버전 1.17.0) – 라이선스 MPL-2.0 -
libjwt는의 하위 디렉터리로 설치됩니다.
/opt/aws/pcs/scheduler/
-
AWS제공된 소프트웨어는 다음과 같이 시스템 구성을 변경합니다.
-
빌드에서 생성한 Slurm
systemd
파일은 파일 이름/etc/systemd/system/
로에 복사됩니다slurmd-23.11.service
. -
Slurm 사용자 및 그룹(
slurm:slurm
)이 없는 경우 UID/GID of 로 생성됩니다401
. -
Amazon Linux 2 및 Rocky Linux 9에서 설치는 EPEL 리포지토리를 추가하여 Slurm 또는 해당 종속성을 빌드하는 데 필요한 소프트웨어를 설치합니다.
-
RHEL9에서 설치는
codeready-builder-for-rhel-9-rhui-rpms
및epel-release-latest-9
에서 Slurm 또는 해당 종속성을 빌드하는 데 필요한 소프트웨어를 설치할fedoraproject
수 있도록 합니다.
지원되는 운영 체제
The AWS PCS 소프트웨어 및 Slurm 설치 프로그램은 다음 운영 체제를 지원합니다.
-
Amazon Linux 2
-
RedHat Enterprise Linux 9
-
Rocky Linux 9
-
Ubuntu 22.04
참고
AWS Deep Learning AMIs Amazon Linux 2 및 Ubuntu 22.04 기반 (DLAMI) 버전은 AWS PCS 소프트웨어 및 Slurm 설치 프로그램과 호환되어야 합니다. 자세한 내용은 AWS Deep Learning AMIs 개발자 안내서의 DLAMI 선택을 참조하세요.
지원되는 인스턴스 유형
AWS PCS 소프트웨어 및 Slurm 설치 프로그램은 지원되는 운영 체제 중 하나를 실행할 수 있는 모든 x86_64 또는 arm64 인스턴스 유형을 지원합니다.
지원되는 Slurm 버전
다음 주요 버전의 Slurm이 지원됩니다.
-
Slurm 23.11
체크섬을 사용하여 설치 관리자 확인
SHA256 체크섬을 사용하여 설치 프로그램 tarball(.tar.gz) 파일을 확인할 수 있습니다. 이 작업을 수행하여 소프트웨어 게시자의 자격 증명을 확인하고 애플리케이션이 게시된 이후 변경되거나 손상되지 않았는지 확인하는 것이 좋습니다.
tarball을 확인하려면
SHA256 체크섬에 sha256sum 유틸리티를 사용하고 tarball 파일 이름을 지정합니다. tarball 파일을 저장한 디렉터리에서 명령을 실행해야 합니다.
-
SHA256
$
sha256sumtarball_filename.tar.gz
명령은 체크섬 값을 다음 형식으로 반환해야 합니다.
checksum_value
tarball_filename.tar.gz
명령에서 반환된 체크섬 값을 다음 표에 제공된 체크섬 값과 비교합니다. 체크섬이 일치하면 설치 스크립트를 실행하는 것이 안전합니다.
중요
체크섬이 일치하지 않으면 설치 스크립트를 실행하지 마세요. AWS Support
예를 들어 다음 명령은 Slurm 23.11.10 tarball에 대한 SHA256 체크섬을 생성합니다.
$
sha256sum aws-pcs-slurm-23.11-installer-23.11.10-1.tar.gz
출력 예제:
1de7d919c8632fe8e2806611bed4fde1005a4fadc795412456e935c7bba2a9b8 aws-pcs-slurm-23.11-installer-23.11.10-1.tar.gz
다음 표에는 최신 버전의 설치 관리자에 대한 체크섬이 나열되어 있습니다. Replace us-east-1
를 사용하여 AWS PCS를 AWS 리전 사용합니다.
설치 관리자 | URL 다운로드 | SHA256 체크섬 |
---|---|---|
AWS PCSagent 1.0.1-1 |
|
|
AWS PCSagent 1.0.0-1 |
|
|
Slurm 23.11.10-1 |
|
|
Slurm 23.11.9-1 |
|
|