SageMaker HyperPod 참고 문헌 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SageMaker HyperPod 참고 문헌

다음 SageMaker HyperPod 주제에서 사용에 대한 자세한 정보 및 참고 자료를 찾아보십시오.

SageMaker HyperPod 가격 책정

다음 항목에서는 SageMaker HyperPod 가격 책정에 대한 정보를 제공합니다. SageMaker HyperPod 인스턴스 사용에 대한 시간당 요금에 대한 자세한 내용은 Amazon SageMaker 요금을 참조하십시오.

용량 요청

에서 사용하도록 온디맨드 또는 예약된 컴퓨팅 SageMaker 파워를 할당할 수 있습니다. SageMaker HyperPod 온디맨드 클러스터 생성은 온디맨드 용량 풀에서 사용 가능한 용량을 할당합니다. SageMaker 또는 할당량 증가 티켓을 제출하여 액세스가 보장되도록 예약 용량을 요청할 수도 있습니다. 인바운드 용량 요청은 에 따라 우선 순위가 SageMaker 지정되며 용량 할당에 소요되는 예상 시간을 확인할 수 있습니다.

서비스 요금 청구

컴퓨팅 파워를 SageMaker HyperPod 프로비저닝하면 용량 할당 기간에 대한 요금이 청구됩니다. SageMaker HyperPod 청구서는 1주년 청구서에 용량 할당 유형 (온디맨드, 예약), 인스턴스 유형, 인스턴스 사용에 소요된 시간에 대한 항목과 함께 표시됩니다.

할당량 증가 티켓을 제출하려면 을 참조하십시오SageMaker HyperPod 할당량.

SageMaker HyperPod APIs

다음 목록은 다음과 같은 JSON 형식으로 작업 요청을 제출하기 SageMaker HyperPod APIs 위한 전체 목록입니다 SageMaker . AWS CLI 또는 AWS SDK for Python (Boto3).

SageMaker HyperPod 양식

에서 Slurm 워크로드 관리자 도구를 구성하려면 HyperPod 제공된 양식을 HyperPod 사용하여 필요한 Slurm 구성 파일을 생성해야 합니다.

Slurm 노드를 프로비저닝하기 위한 구성 양식 HyperPod

다음 코드는 클러스터에 Slurm 노드를 올바르게 설정하기 위해 준비해야 하는 Slurm 구성 양식입니다. HyperPod 클러스터를 생성하는 동안 이 양식을 작성하여 라이프사이클 스크립트 세트의 일부로 업로드해야 합니다. HyperPod 클러스터 생성 프로세스 전반에 걸쳐 이 양식을 준비하는 방법을 알아보려면 을 참조하십시오SageMaker HyperPod 수명 주기 구성 모범 사례.

// Save as provisioning_params.json. { "version": "1.0.0", "workload_manager": "slurm", "controller_group": "string", "login_group": "string", "worker_groups": [ { "instance_group_name": "string", "partition_name": "string" } ], "fsx_dns_name": "string", "fsx_mountname": "string" }
  • version - 필수입니다. 이것은 HyperPod 프로비저닝 파라미터 양식의 버전입니다. 그대로 두세요. 1.0.0

  • workload_manager - 필수입니다. HyperPod 클러스터에 구성할 워크로드 관리자를 지정하기 위한 것입니다. 계속 보관하세요slurm.

  • controller_group - 필수입니다. Slurm 컨트롤러 (헤드) 노드에 할당하려는 HyperPod 클러스터 인스턴스 그룹의 이름을 지정하기 위한 것입니다.

  • login_group – 선택 사항입니다. Slurm 로그인 노드에 할당하려는 HyperPod 클러스터 인스턴스 그룹의 이름을 지정하기 위한 것입니다.

  • worker_groups - 필수입니다. 클러스터에 Slurm 작업자 (컴퓨팅) 노드를 설정하기 위한 것입니다. HyperPod

    • instance_group_name - 필수입니다. 이는 Slurm 작업자 (컴퓨팅) 노드에 할당하려는 HyperPod 인스턴스 그룹의 이름을 지정하기 위한 것입니다.

    • partition_name - 필수입니다. 노드에 파티션 이름을 지정하기 위한 것입니다.

  • fsx_dns_name – 선택 사항입니다. FSxAmazon과 통신하도록 HyperPod 클러스터의 Slurm 노드를 설정하려면 이름을 지정하십시오. FSx DNS

  • fsx_mountname – 선택 사항입니다. FSxAmazon과 통신하도록 HyperPod 클러스터의 Slurm 노드를 설정하려면 FSx 마운트 이름을 지정하십시오.

SageMaker HyperPod DLAMI

SageMaker HyperPod 다음을 DLAMI 기반으로 a를 실행합니다.

Slurm, Kubernetes, 종속성 및 클러스터 상태 점검 및 자동 재개와 같은 복원력 기능을 지원하는 SageMaker HyperPod 클러스터 소프트웨어 패키지와 같은 오픈 소스 도구를 지원하는 추가 패키지와 함께 번들로 제공됩니다. SageMaker HyperPod DLAMI 서비스 팀이 배포하는 HyperPod 소프트웨어 업데이트에 대한 후속 조치는 을 참조하십시오. HyperPod DLAMIs 아마존 SageMaker HyperPod 릴리스 노트

SageMaker HyperPod API권한 참조

중요

Amazon SageMaker Studio 또는 Amazon SageMaker Studio Classic에서 Amazon SageMaker 리소스를 생성할 수 있도록 허용하는 사용자 지정 IAM 정책은 해당 리소스에 태그를 추가할 권한도 부여해야 합니다. Studio 및 Studio Classic은 생성한 모든 리소스에 자동으로 태그를 지정하기 때문에 리소스에 태그를 추가할 수 있는 권한이 필요합니다. IAM정책에 따라 Studio 및 Studio Classic에서는 리소스를 생성할 수 있지만 태깅은 허용하지 않는 경우 AccessDenied "“리소스를 만들려고 할 때 오류가 발생할 수 있습니다. 자세한 내용은 리소스에 태그를 지정할 SageMaker 수 있는 권한을 제공하십시오. 단원을 참조하십시오.

AWS 아마존 관리형 정책 SageMaker SageMaker 리소스를 생성할 수 있는 권한을 부여하는 경우 해당 리소스를 생성하는 동안 태그를 추가할 수 있는 권한이 이미 포함되어 있습니다.

SageMaker HyperPod API작업을 실행할 수 있도록 액세스 제어를 설정하고 클라우드 관리자를 위해 IAM 사용자에게 연결할 수 있는 권한 정책을 작성할 때는 다음 표를 참조로 사용하십시오.

아마존 SageMaker API 오퍼레이션 필수 권한 (API조치) 리소스
CreateCluster sagemaker:CreateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DeleteCluster sagemaker:DeleteCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeCluster sagemaker:DescribeCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
DescribeClusterNode sagemaker:DescribeClusterNode arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusterNodes sagemaker:ListClusterNodes arn:aws:sagemaker:region:account-id:cluster/cluster-id
ListClusters sagemaker:ListClusters arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateCluster sagemaker:UpdateCluster arn:aws:sagemaker:region:account-id:cluster/cluster-id
UpdateClusterSoftware sagemaker:UpdateClusterSoftware arn:aws:sagemaker:region:account-id:cluster/cluster-id

권한 및 리소스 유형의 전체 목록은 SageMakerAmazon의 작업, 리소스 및 조건 키를 참조하십시오. SageMaker APIs AWS 서비스 인증 레퍼런스.

SageMaker HyperPod 명령어 입력 AWS CLI

다음은 다음과 같습니다. AWS CLI 핵심 HyperPod API작업을 SageMaker HyperPod 실행하기 위한 명령입니다.

SageMaker HyperPod Python 모듈이 들어 있습니다. AWS SDK for Python (Boto3)

의 메서드는 다음과 같습니다. AWS SDK for Python (Boto3) 핵심 HyperPod API작업을 SageMaker 실행하기 위한 클라이언트.