SageMaker HyperPod 사용을 위한 사전 조건 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SageMaker HyperPod 사용을 위한 사전 조건

다음 섹션에서는 를 시작하기 전에 사전 조건을 안내합니다 SageMaker HyperPod.

SageMaker HyperPod 할당량

AWS 계정에서 SageMaker HyperPod 클러스터 사용에 대한 할당량을 고려하여 클러스터를 생성할 수 있습니다.

중요

SageMaker HyperPod 요금에 대한 자세한 내용은 SageMaker HyperPod 가격 책정Amazon SageMaker 요금 섹션을 참조하세요.

AWS 관리 콘솔을 사용하여 Amazon SageMaker HyperPod 할당량 보기

에 사용되는 클러스터 사용량 에 대해 한도라고도 하는 할당량의 기본값 및 적용된 값을 검색합니다 SageMaker HyperPod.

  1. Service Quotas 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 AWS 서비스( services)를 선택합니다.

  3. AWS 서비스 목록에서 Amazon SageMaker를 검색하고 선택합니다.

  4. 서비스 할당량 목록에서 서비스 할당량 이름, 적용된 값(사용 가능한 경우), AWS 기본 할당량 및 할당량 값을 조정할 수 있는지 여부를 확인할 수 있습니다.

  5. 검색 창에 클러스터 사용량을 입력합니다. 클러스터 사용 할당량, 적용된 할당량 및 기본 할당량을 보여줍니다.

AWS 관리 콘솔을 사용한 Amazon SageMaker HyperPod 할당량 요청

계정 또는 리소스 수준에서 할당량을 늘립니다.

  1. 클러스터 사용량에 대한 인스턴스 할당량을 늘리려면 늘리려는 할당량을 선택합니다.

  2. 할당량이 조정 가능한 경우 조정 가능성 열에 나열된 값을 기반으로 계정 수준 또는 리소스 수준에서 할당량 증가를 요청할 수 있습니다.

  3. 할당량 증가 값 에 새 값을 입력합니다. 새 값은 현재 값보다 커야 합니다.

  4. 요청을 선택합니다.

  5. 콘솔에서 보류 중이거나 최근에 해결된 요청을 보려면 서비스 세부 정보 페이지에서 요청 기록 탭으로 이동하거나 탐색 창에서 대시보드를 선택합니다. 보류 중인 요청의 경우 요청 상태를 선택하여 요청 접수증을 엽니다. 요청의 초기 상태는 Pending(보류 중)입니다. 상태가 Quota requested 로 변경되면 와 함께 사례 번호가 표시됩니다 AWS Support. 이 케이스 번호를 선택하여 요청의 티켓을 엽니다.

일반적인 할당량 증가 요청에 대한 자세한 내용은 AWS Service Quotas 사용 설명서할당량 증가 요청을 참조하세요.

Amazon으로 SageMaker HyperPod 설정 VPC

Amazon 로 SageMaker HyperPod 클러스터를 설정하려면 다음 항목을 VPC확인하세요.

참고

를 사용하여 오케스트레이션하는 데 필요하며 EKS HyperPod 클러저VPC에 동일한 를 사용해야 합니다. Slurm을 사용한 오케스트레이션의 경우 자체 설정은 선택 사항VPC입니다.

  • 자체 VPC 를 사용하여 의 AWS 리소스 SageMaker HyperPod 에 연결하려면 를 생성할 때 VPC 이름, ID, AWS 리전서브넷 ID 및 보안 그룹 ID를 제공해야 VPC합니다 SageMaker HyperPod. 새 를 생성하려면 Amazon Virtual Private Cloud 사용 설명서기본VPC생성 VPC 또는 생성을 VPC참조하세요.

  • 동일한 AWS 리전 가용 영역에 모든 리소스를 생성하고 의 리소스 간 연결을 허용하도록 보안 그룹 규칙을 구성하는 것이 중요합니다VPC. 예를 들어 VPC에서 를 생성한다고 가정해 보겠습니다us-west-2. 가용 영역 에서 이 VPC에 서브넷을 생성하고, 보안 그룹 내부에서 들어오는 모든(인바운드) 트래픽과 모든 아웃바운드 트래픽을 허용하는 보안 그룹을 us-west-2a생성해야 합니다.

  • 또한 VPC 가 (Amazon S3)에 Amazon Simple Storage Service 연결되어 있는지 확인해야 합니다. 를 구성하는 경우 VPC SageMaker HyperPod 인스턴스 그룹은 인터넷에 액세스할 수 없으므로 수명 주기 스크립트, 훈련 데이터 및 모델 아티팩트와 같은 파일에 액세스하거나 저장하기 위해 Amazon S3에 연결할 수 없습니다. 를 사용하는 동안 Amazon S3와의 연결을 설정하려면 VPC 엔드포인트를 생성VPC해야 합니다. VPC 엔드포인트를 생성하여 SageMaker HyperPod 인스턴스 그룹이 동일한 내의 Amazon S3 버킷에 액세스하도록 허용할 수 있습니다VPC. 또한 프라이빗의 요청만 Amazon S3 버킷VPC에 액세스할 수 있도록 허용하는 사용자 지정 정책을 생성하는 것이 좋습니다. 자세한 내용은 AWS PrivateLink 가이드 Amazon S3용 엔드포인트를 참조하세요.

  • EFA사용 가능한 인스턴스가 있는 HyperPod 클러스터를 생성하려면 보안 그룹 자체에서 모든 인바운드 및 아웃바운드 트래픽을 허용하도록 보안 그룹을 설정해야 합니다. 자세한 내용은 Amazon EC2 사용 설명서1단계: EFA활성화된 보안 그룹 준비를 참조하세요.

클러스터 사용자 액세스 제어를 위해 설정 AWS Systems Manager 및 다른 이름으로 실행

SageMaker HyperPod DLAMI 는 SageMaker HyperPod 클러스터 인스턴스 그룹에 대한 액세스를 관리하는 데 도움이 되도록 AWS Systems Manager (SSM)를 기본으로 제공합니다. 이 섹션에서는 SageMaker HyperPod 클러스터에서 운영 체제(OS) 사용자를 생성하고 사용자 및 IAM 역할과 연결하는 방법을 설명합니다. 이는 OS 사용자 계정의 자격 증명을 사용하여 SSM 세션을 인증하는 데 유용합니다.

AWS 계정에서 다른 이름으로 실행 활성화

AWS 계정 관리자 또는 클라우드 관리자는 의 다른 이름으로 실행 기능을 사용하여 IAM 역할 또는 사용자 수준에서 SageMaker HyperPod 클러스터에 대한 액세스를 관리할 수 있습니다. SSM 이 기능을 사용하면 IAM 역할 또는 사용자와 연결된 OS 사용자를 사용하여 각 SSM 세션을 시작할 수 있습니다.

AWS 계정에서 다른 이름으로 실행을 활성화하려면 Linux 및 macOS 관리형 노드에 대한 다른 이름으로 실행 지원 켜기의 단계를 따릅니다. 클러스터에서 OS 사용자를 이미 생성한 경우 Linux 및 macOS 관리형 노드 에 대한 Run As 지원을 켜려면 5단계의 옵션 2에 안내된 대로 태그를 지정하여 IAM 역할 또는 사용자와 연결해야 합니다.

(선택 사항) Amazon FSx for Lustre SageMaker HyperPod 로 설정

클러스터 SageMaker HyperPod 와 FSx for Lustre 파일 시스템 간의 데이터 경로 사용 및 매핑을 시작하려면 에서 AWS 리전 지원하는 중 하나를 선택합니다 SageMaker HyperPod. AWS 리전 원하는 를 선택한 후 사용할 가용 영역(AZ)도 결정해야 합니다. FSx for Lustre 파일 시스템이 동일한 내에 설정된 AZs 와 AZs 다른 에서 SageMaker HyperPod 컴퓨팅 노드를 사용하는 경우 통신 및 네트워크 오버헤드가 발생할 AWS 리전수 있습니다. SageMaker HyperPod 클러스터와 FSx for Lustre 파일 시스템 간의 교차 AZ 트래픽을 방지하려면 SageMaker HyperPod 서비스 계정과 동일한 물리적 AZ를 사용하는 것이 좋습니다. 또한 로 구성했는지 확인합니다VPC. Amazon을 스토리지FSx의 기본 파일 시스템으로 사용하려면 를 사용하여 SageMaker HyperPod 클러스터를 구성해야 합니다VPC.