기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
지원되는 프레임워크 및 알고리즘
다음 표에는 Debugger에서 지원하는 SageMaker 기계 학습 프레임워크 및 알고리즘이 나와 있습니다.
SageMaker-supported frameworks and algorithms | Debugging output tensors |
---|---|
AWS TensorFlow 딥 러닝 컨테이너 |
|
AWS PyTorch 딥 러닝 컨테이너 |
|
AWS MXNet 딥 러닝 컨테이너 |
|
1.0-1, 1.2-1, 1.3-1 |
|
사용자 지정 훈련 컨테이너( TensorFlow, PyTorch, MXNet및 수동 후크 등록 XGBoost 포함) |
-
출력 텐서 디버깅 - 훈련 작업의 가중치, 그라데이션, 편향, 스칼라 값 등 모델 파라미터를 추적하고 디버깅합니다. 사용 가능한 딥 러닝 프레임워크는 Apache MXNet, TensorFlow, 및 PyTorch입니다XGBoost.
중요
Keras를 사용하는 TensorFlow 프레임워크의 경우 SageMaker Debugger는 TensorFlow 2.6 이상의
tf.keras
모듈을 사용하여 구축된 디버깅 모델에 대한 제로 코드 변경 지원을 사용하지 않습니다. 이는 TensorFlow 2.6.0 릴리스 정보에 발표된 변경 사항이 중단되었기 때문입니다. 훈련 스크립트를 업데이트하는 방법에 대한 지침은 TensorFlow 훈련 스크립트 조정을(를) 참조하세요. 중요
PyTorch v1.12.0 이상에서 SageMaker 디버거는 디버깅 모델에 대한 제로 코드 변경 지원을 중단합니다.
이는 SageMaker Debugger가
torch.jit
기능을 방해하는 변경 사항이 중단되었기 때문입니다. 훈련 스크립트를 업데이트하는 방법에 대한 지침은 PyTorch 훈련 스크립트 조정을(를) 참조하세요.
훈련 및 디버깅하려는 프레임워크 또는 알고리즘이 테이블에 나열되지 않은 경우 AWS 토론 포럼
AWS 리전
Amazon SageMaker Debugger는 다음 리전을 제외하고 Amazon SageMaker 이 서비스 중인 모든 리전에서 사용할 수 있습니다.
아시아 태평양(자카르타):
ap-southeast-3
Amazon SageMaker 이 에서 서비스 중인지 확인하려면 AWS 리전 서비스 섹션을
사용자 지정 훈련 컨테이너로 Debugger 사용용
Debugger를 사용하여 훈련 컨테이너를 로 가져오 SageMaker 고 훈련 작업에 대한 인사이트를 얻으세요. 모니터링 및 디버깅 기능을 사용하여 Amazon EC2 인스턴스에서 모델을 최적화하여 작업 효율성을 극대화합니다.
sagemaker-debugger
클라이언트 라이브러리를 사용하여 훈련 컨테이너를 빌드하는 방법에 대한 자세한 내용은 Amazon Elastic Container Registry(AmazonECR)로 푸시하고 를 모니터링하고 디버그하려면 섹션을 참조하세요사용자 지정 훈련 컨테이너에서 Debugger 사용.
디버거 오픈 소스 리 GitHub 포지토리
DebuggerAPIs는 SageMaker Python을 통해 제공되며 SDK 및 DescribeTrainingJob API 작업에 대한 SageMaker CreateTrainingJob Debugger 후크 및 규칙 구성을 구성하도록 설계되었습니다. sagemaker-debugger
클라이언트 라이브러리는 유연하고 강력한 API 작업을 통해 평가판 기능을 통해 후크를 등록하고 훈련 데이터에 액세스할 수 있는 도구를 제공합니다. Python 3.6 이상XGBoost에서 기계 학습 프레임워크 PyTorch TensorFlow, MXNet, 및 를 지원합니다.
디버거 및 sagemaker-debugger
API 작업에 대한 직접 리소스는 다음 링크를 참조하세요.
JavaSDK용 를 사용하여 SageMaker 훈련 작업을 수행하고 Debugger를 구성하려는 경우 다음 참조를 APIs참조하세요.