기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon SageMaker AI의 TensorBoard
TensorBoard를 사용하는 Amazon SageMaker AI는 TensorBoard
참고
이 기능은 PyTorch 또는 TensorFlow를 사용하여 딥러닝 모델의 훈련을 디버깅하기 위한 것입니다.
데이터 과학자용
대형 모델을 훈련시키려면 데이터 과학자가 모델 융합을 개선하고 경사하강법(gradient descent) 프로세스를 안정화하기 위해 모델을 디버깅하고 해결해야 하는 과학적 문제가 발생할 수 있습니다.
손실이 수렴하지 않거나 가중치와 기울기가 사라지거나 폭발적으로 증가하는 등 모델 훈련 문제가 발생하면 텐서 데이터에 액세스하여 모델 파라미터, 스칼라 및 사용자 지정 메트릭을 심층적으로 분석해야 합니다. TensorBoard와 함께 SageMaker AI를 사용하면 훈련 작업에서 추출한 모델 출력 텐서를 시각화할 수 있습니다. 다양한 모델, 여러 번의 훈련 실행, 모델 하이퍼파라미터를 실험하면서 TensorBoard에서 여러 훈련 작업을 선택하고 한 곳에서 이들을 비교할 수 있습니다.
관리자용
SageMaker AI 콘솔 또는 SageMaker AI 도메인의 TensorBoard 랜딩 페이지를 통해 AWS 계정 또는 SageMaker AI 도메인의 관리자인 경우 TensorBoard 애플리케이션 사용자를 관리할 수 있습니다. 각 도메인 사용자는 부여된 권한이 주어지면 자신의 TensorBoard 애플리케이션에 액세스할 수 있습니다. SageMaker AI 도메인 관리자 및 도메인 사용자는 권한 수준을 고려하여 TensorBoard 애플리케이션을 생성하고 삭제할 수 있습니다.
참고
SageMaker AI 도메인은 사용자 간의 애플리케이션 공유를 허용하지 않으므로 협업 목적으로 TensorBoard 애플리케이션을 공유할 수 없습니다. 사용자는 버킷에 액세스할 수 있는 경우 S3 버킷에 저장된 출력 텐서를 공유할 수 있습니다.
지원되는 프레임워크 및 AWS 리전
SageMaker AI의 TensorBoard 애플리케이션은 다음 기계 학습 프레임워크 및에 사용할 수 있습니다 AWS 리전.
프레임워크
-
PyTorch
-
TensorFlow
-
Hugging Face 트랜스포머
AWS 리전
-
미국 동부 (버지니아 북부) (
us-east-1
) -
미국 동부 (오하이오)(
us-east-2
) -
미국 서부 (오리건) (
us-west-2
) -
EU (프랑크푸르트)(
eu-central-1
) -
EU (아일랜드)(
eu-west-1
)
참고
TensorBoard를 사용하는 Amazon SageMaker AI는 ml.r5.large
인스턴스에서 실행되며 SageMaker AI 프리 티어 또는 기능의 무료 평가판 기간이 지나면 요금이 발생합니다. 자세한 내용은 Amazon SageMaker AI 요금을