SageMaker HyperPod 클러스터 생성 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SageMaker HyperPod 클러스터 생성

SageMaker HyperPod 콘솔 UI를 사용하여 새 SageMaker HyperPod 클러스터를 생성하는 방법은 다음 지침을 참조하세요.

  1. 에서 Amazon SageMaker 콘솔을 엽니다https://console.aws.amazon.com/sagemaker/.

  2. 왼쪽 탐색 창에서 HyperPod 클러스터를 선택합니다.

  3. SageMaker HyperPod 랜딩 페이지에서 HyperPod 클러스터 생성을 선택합니다.

  4. 클러스터 생성 HyperPod 의 드롭다운 메뉴에서 Amazon에서 오케스트레이션을 EKS선택합니다.

  5. Amazon EKS 클러스터 목록에서 새 EKS 클러스터를 구성할 HyperPod 클러스터를 선택합니다.

    1. 새 EKS 클러스터를 생성해야 하는 경우 EKS 클러스터 생성 을 선택합니다. Amazon EKS 콘솔을 열지 않고도 EKS 클러스터 목록 페이지에서 생성할 수 있습니다.

      참고

      선택한 VPC 서브넷은 프라이빗이어야 HyperPod 합니다.

    2. 새 EKS 클러스터 생성 요청을 제출한 후 EKS 클러스터가 활성화될 때까지 기다립니다.

    3. 의 지침에 따라 Helm 차트를 설치합니다Helm을 사용하여 Amazon EKS 클러스터에 패키지 설치.

    4. EKS 클러스터 생성이 완료되면 HyperPod 클러스터 생성을 선택한 다음 에 의해 다시 오케스트레이션됩니다EKS. 새 EKS 클러스터를 찾아 선택할 수 있어야 합니다. 계속하려면 선택을 선택합니다.

  6. 새 HyperPod 클러스터 구성 페이지에서 이름, 클러스터 복원력 기능을 활성화하는 옵션 및 태그와 같은 HyperPod 클러스터의 기본 정보를 설정합니다.

  7. 클러스터 이름 에 새 클러스터의 이름을 지정합니다.

  8. 클러스터 복원력 - 노드 복구의 경우 자동 노드 복구를 활성화Automatic하도록 를 지정합니다. SageMaker HyperPod 상태 모니터링 에이전트에서 문제가 발견되면 인스턴스(노드)를 교체하거나 재부팅합니다.

  9. 태그 의 경우 새 클러스터에 키 및 값 페어를 추가하고 클러스터를 AWS 리소스로 관리합니다. 자세한 내용은 AWS 리소스 태그 지정을 참조하세요.

  10. 2단계: 인스턴스 그룹 구성에서 인스턴스 그룹 생성을 선택합니다. 각 인스턴스 그룹을 다르게 구성할 수 있으며 다양한 인스턴스 유형을 가진 여러 인스턴스 그룹으로 구성된 이종 클러스터를 생성할 수 있습니다. 인스턴스 그룹 구성 생성 팝업 창에서 인스턴스 그룹 구성 정보를 입력합니다.

    인스턴스 그룹 팝업 페이지를 생성하고 UI 지침에 따라 새 인스턴스 그룹을 구성합니다.

    1. 인스턴스 그룹 이름 에 인스턴스 그룹의 이름을 지정합니다.

    2. 인스턴스 유형 선택에서 인스턴스 그룹의 인스턴스를 선택합니다.

    3. 수량 에서 클러스터 사용에 대한 인스턴스 할당량을 초과하지 않는 정수를 지정합니다.

    4. 수명 주기 구성 스크립트를 준비하고 와 같은 Amazon S3 버킷에 업로드합니다s3://sagemaker-amzn-s3-demo-bucket>/<lifecycle-script-directory>/src/.

      빠른 시작을 위해 AWS ome Distributed Training GitHub 리포지토리on_create.sh에서 샘플 스크립트를 다운로드하여 S3 버킷에 업로드합니다. 이 스크립트는 포드 컨테이너에서 로그를 수집하는 CloudWatch 데 /var/log/provision/provisioning.log 필요한 로깅 파일을 설정합니다. HyperPod 클러스터 프로비저닝 단계에서 실행할 추가 설정 지침, 일련의 설정 스크립트 또는 명령을 포함할 수도 있습니다.

    5. 수명 주기 스크립트URI용 S3 버킷 에 수명 주기 스크립트가 저장되는 Amazon S3 경로를 입력합니다.

    6. 기본 Amazon S3 경로 의 진입점 스크립트에 대한 디렉터리 경로의 경우 수명 주기 스크립트 파일 의 Amazon S3 경로 아래에 수명 주기 스크립트의 파일 이름을 입력합니다. 제공된 샘플 스크립트를 사용하는 경우 를 입력합니다on_create.sh.

    7. IAM 역할의 경우 섹션 다음에 따라 SageMaker HyperPod 리소스에 대해 생성한 IAM 역할을 선택합니다IAM역할: SageMaker HyperPod.

    8. 고급 구성 에서 다음과 같은 선택적 구성을 설정할 수 있습니다.

      1. (선택 사항) 코어당 스레드 의 경우 다중 스레드 비활성화 및 다중 스레드 활성화21 지정합니다. 멀티스레딩을 지원하는 인스턴스 유형을 찾으려면 Amazon EC2 사용 설명서CPU 인스턴스 유형별 코어 및 CPU 코어당 스레드의 참조 표를 참조하세요.

      2. (선택 사항) 추가 인스턴스 스토리지 구성의 경우 1~16384 사이의 정수를 지정하여 추가 Elastic Block Store(EBS) 볼륨의 크기를 기가바이트(GB) 단위로 설정합니다. EBS 볼륨은 인스턴스 그룹의 각 인스턴스에 연결됩니다. 추가 EBS 볼륨의 기본 탑재 경로는 입니다/opt/sagemaker. 클러스터가 성공적으로 생성된 후 클러스터 인스턴스(노드)SSH로 들어가 df -h 명령을 실행하여 EBS 볼륨이 올바르게 마운트되었는지 확인할 수 있습니다. 추가 EBS 볼륨을 연결하면 Amazon Elastic Block Store 사용 설명서Amazon EBS 볼륨 섹션에 설명된 대로 안정적이고 인스턴스가 아니며 독립적으로 지속되는 스토리지가 제공됩니다.

  11. 심층 상태 확인 에서 인스턴스에서 실행하려는 고급 상태 확인을 선택합니다. 자세한 내용은 심층 상태 확인을 참조하십시오.

  12. 3단계: 고급 구성 에서 클러스터 및 in-and-out 클러스터의 네트워크 설정을 구성합니다. Amazon 를 사용한 SageMaker HyperPod 클러스터 오케스트레이션의 경우 EKSVPC는 선택한 EKS 클러스터로 구성된 클러스터로 자동으로 설정됩니다.

  13. 4단계: 검토 및 생성에서 1단계에서 3단계로 설정한 구성을 검토하고 클러스터 생성 요청 제출을 완료합니다.

  14. 클러스터 상태가 로 전환되면 클러스터 노드에 로그인을 시작할 InService수 있습니다. 클러스터 노드에 액세스하고 ML 워크로드 실행을 시작하려면 섹션을 참조하세요 SageMaker HyperPod 클러스터의 작업.