기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SageMaker HyperPod 클러스터 생성
SageMaker HyperPod 콘솔 UI를 사용하여 새 SageMaker HyperPod 클러스터를 생성하는 방법은 다음 지침을 참조하세요.
-
에서 Amazon SageMaker 콘솔을 엽니다https://console.aws.amazon.com/sagemaker/
. -
왼쪽 탐색 창에서 HyperPod 클러스터를 선택합니다.
-
SageMaker HyperPod 랜딩 페이지에서 HyperPod 클러스터 생성을 선택합니다.
-
클러스터 생성 HyperPod 의 드롭다운 메뉴에서 Amazon에서 오케스트레이션을 EKS선택합니다.
-
Amazon EKS 클러스터 목록에서 새 EKS 클러스터를 구성할 HyperPod 클러스터를 선택합니다.
-
새 EKS 클러스터를 생성해야 하는 경우 EKS 클러스터 생성 을 선택합니다. Amazon EKS 콘솔을 열지 않고도 EKS 클러스터 목록 페이지에서 생성할 수 있습니다.
참고
선택한 VPC 서브넷은 프라이빗이어야 HyperPod 합니다.
-
새 EKS 클러스터 생성 요청을 제출한 후 EKS 클러스터가 활성화될 때까지 기다립니다.
-
의 지침에 따라 Helm 차트를 설치합니다Helm을 사용하여 Amazon EKS 클러스터에 패키지 설치.
-
EKS 클러스터 생성이 완료되면 HyperPod 클러스터 생성을 선택한 다음 에 의해 다시 오케스트레이션됩니다EKS. 새 EKS 클러스터를 찾아 선택할 수 있어야 합니다. 계속하려면 선택을 선택합니다.
-
-
새 HyperPod 클러스터 구성 페이지에서 이름, 클러스터 복원력 기능을 활성화하는 옵션 및 태그와 같은 HyperPod 클러스터의 기본 정보를 설정합니다.
-
클러스터 이름 에 새 클러스터의 이름을 지정합니다.
-
클러스터 복원력 - 노드 복구의 경우 자동 노드 복구를 활성화
Automatic
하도록 를 지정합니다. SageMaker HyperPod 상태 모니터링 에이전트에서 문제가 발견되면 인스턴스(노드)를 교체하거나 재부팅합니다. -
태그 의 경우 새 클러스터에 키 및 값 페어를 추가하고 클러스터를 AWS 리소스로 관리합니다. 자세한 내용은 AWS 리소스 태그 지정을 참조하세요.
-
2단계: 인스턴스 그룹 구성에서 인스턴스 그룹 생성을 선택합니다. 각 인스턴스 그룹을 다르게 구성할 수 있으며 다양한 인스턴스 유형을 가진 여러 인스턴스 그룹으로 구성된 이종 클러스터를 생성할 수 있습니다. 인스턴스 그룹 구성 생성 팝업 창에서 인스턴스 그룹 구성 정보를 입력합니다.
인스턴스 그룹 팝업 페이지를 생성하고 UI 지침에 따라 새 인스턴스 그룹을 구성합니다.
-
인스턴스 그룹 이름 에 인스턴스 그룹의 이름을 지정합니다.
-
인스턴스 유형 선택에서 인스턴스 그룹의 인스턴스를 선택합니다.
-
수량 에서 클러스터 사용에 대한 인스턴스 할당량을 초과하지 않는 정수를 지정합니다.
-
수명 주기 구성 스크립트를 준비하고 와 같은 Amazon S3 버킷에 업로드합니다
s3://sagemaker-amzn-s3-demo-bucket>/<lifecycle-script-directory>/src/
.빠른 시작을 위해 AWS ome Distributed Training GitHub 리포지토리
on_create.sh
에서 샘플 스크립트를 다운로드하여 S3 버킷에 업로드합니다. 이 스크립트는 포드 컨테이너에서 로그를 수집하는 CloudWatch 데 /var/log/provision/provisioning.log
필요한 로깅 파일을 설정합니다. HyperPod 클러스터 프로비저닝 단계에서 실행할 추가 설정 지침, 일련의 설정 스크립트 또는 명령을 포함할 수도 있습니다. -
수명 주기 스크립트URI용 S3 버킷 에 수명 주기 스크립트가 저장되는 Amazon S3 경로를 입력합니다.
-
기본 Amazon S3 경로 의 진입점 스크립트에 대한 디렉터리 경로의 경우 수명 주기 스크립트 파일 의 Amazon S3 경로 아래에 수명 주기 스크립트의 파일 이름을 입력합니다. 제공된 샘플 스크립트를 사용하는 경우 를 입력합니다
on_create.sh
. -
IAM 역할의 경우 섹션 다음에 따라 SageMaker HyperPod 리소스에 대해 생성한 IAM 역할을 선택합니다IAM역할: SageMaker HyperPod.
-
고급 구성 에서 다음과 같은 선택적 구성을 설정할 수 있습니다.
-
(선택 사항) 코어당 스레드 의 경우 다중 스레드 비활성화 및 다중 스레드 활성화
2
를1
지정합니다. 멀티스레딩을 지원하는 인스턴스 유형을 찾으려면 Amazon EC2 사용 설명서의 CPU 인스턴스 유형별 코어 및 CPU 코어당 스레드의 참조 표를 참조하세요. -
(선택 사항) 추가 인스턴스 스토리지 구성의 경우 1~16384 사이의 정수를 지정하여 추가 Elastic Block Store(EBS) 볼륨의 크기를 기가바이트(GB) 단위로 설정합니다. EBS 볼륨은 인스턴스 그룹의 각 인스턴스에 연결됩니다. 추가 EBS 볼륨의 기본 탑재 경로는 입니다
/opt/sagemaker
. 클러스터가 성공적으로 생성된 후 클러스터 인스턴스(노드)SSH로 들어가df -h
명령을 실행하여 EBS 볼륨이 올바르게 마운트되었는지 확인할 수 있습니다. 추가 EBS 볼륨을 연결하면 Amazon Elastic Block Store 사용 설명서의 Amazon EBS 볼륨 섹션에 설명된 대로 안정적이고 인스턴스가 아니며 독립적으로 지속되는 스토리지가 제공됩니다.
-
-
-
심층 상태 확인 에서 인스턴스에서 실행하려는 고급 상태 확인을 선택합니다. 자세한 내용은 심층 상태 확인을 참조하십시오.
-
3단계: 고급 구성 에서 클러스터 및 in-and-out 클러스터의 네트워크 설정을 구성합니다. Amazon 를 사용한 SageMaker HyperPod 클러스터 오케스트레이션의 경우 EKSVPC는 선택한 EKS 클러스터로 구성된 클러스터로 자동으로 설정됩니다.
-
4단계: 검토 및 생성에서 1단계에서 3단계로 설정한 구성을 검토하고 클러스터 생성 요청 제출을 완료합니다.
-
클러스터 상태가 로 전환되면 클러스터 노드에 로그인을 시작할
InService
수 있습니다. 클러스터 노드에 액세스하고 ML 워크로드 실행을 시작하려면 섹션을 참조하세요 SageMaker HyperPod 클러스터의 작업.