이기종 클러스터에서 훈련 작업 실행

포커스 모드

이기종 클러스터에서 훈련 작업 실행 - Amazon SageMaker AI

SageMaker Training의 이기종 클러스터 기능을 사용하면 여러 유형의 ML 인스턴스로 훈련 작업을 실행하여 다양한 ML 훈련 작업 및 목적에 맞게 리소스 규모 조정 및 활용도를 높일 수 있습니다. 예를 들어 GPU 인스턴스가 있는 클러스터에서 훈련 작업을 수행할 때 CPU 사용률이 낮고 CPU 병목 문제가 발생하는 경우, 이기종 클러스터를 사용하면 비용 효율적인 CPU 인스턴스 그룹을 추가하여 CPU 사용량이 많은 작업의 부담을 줄이고 이러한 병목 문제를 해결하고 GPU 활용도를 높일 수 있습니다.

참고

이 기능은 SageMaker Python SDK v2.98.0 이상에서 사용할 수 있습니다.

참고

이 기능은 SageMaker AI PyTorch 및 TensorFlow 프레임워크 예측기 클래스를 통해 사용할 수 있습니다. 지원되는 프레임워크는 파이토치 v1.10 이상 및 텐서플로 v2.6 이상입니다.

또한 Amazon SageMaker AI 이기종 클러스터를 사용하여 모델 훈련의 가격 성능 개선 블로그를 참조하세요.

주제

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

SageMaker AI 환경 변수 및 훈련 스토리지 위치의 기본 경로

Amazon SageMaker AI에서 이기종 클러스터를 사용하여 훈련 작업 구성

쿠키 기본 설정 선택

쿠키 기본 설정 사용자 지정

필수

성능

기능

광고

쿠키 기본 설정을 저장할 수 없음

이기종 클러스터에서 훈련 작업 실행

참고

참고

주제

Related resources

페이지 내용이 도움이 되었습니까?

Related resources

다음 주제:

이전 주제:

도움이 필요하십니까?