Amazon SageMaker AI의 TensorBoard - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Amazon SageMaker AI의 TensorBoard

TensorBoard를 사용하는 Amazon SageMaker AI는 TensorBoard 시각화 도구를 SageMaker AI에 제공하고 SageMaker 훈련 및 도메인과 통합하는 Amazon SageMaker AI의 기능입니다. SageMaker SageMaker AI 도메인을 통해 AWS 계정 및 계정에 속한 사용자를 관리하고, 도메인 사용자에게 Amazon S3에 대한 적절한 권한을 가진 TensorBoard 데이터에 대한 액세스 권한을 부여하고, 도메인 사용자가 TensorBoard 시각화 플러그인을 사용하여 모델 디버깅 작업을 수행할 수 있도록 지원하는 옵션을 제공합니다. TensorBoard를 사용하는 SageMaker AI는 도메인 사용자가 TensorBoard 애플리케이션 내에서 한 곳에서 여러 훈련 작업에 액세스할 수 있는 SageMaker AI Data Manager 플러그인으로 확장됩니다.

참고

이 기능은 PyTorch 또는 TensorFlow를 사용하여 딥러닝 모델의 훈련을 디버깅하기 위한 것입니다.

데이터 과학자용

대형 모델을 훈련시키려면 데이터 과학자가 모델 융합을 개선하고 경사하강법(gradient descent) 프로세스를 안정화하기 위해 모델을 디버깅하고 해결해야 하는 과학적 문제가 발생할 수 있습니다.

손실이 수렴하지 않거나 가중치와 기울기가 사라지거나 폭발적으로 증가하는 등 모델 훈련 문제가 발생하면 텐서 데이터에 액세스하여 모델 파라미터, 스칼라 및 사용자 지정 메트릭을 심층적으로 분석해야 합니다. TensorBoard와 함께 SageMaker AI를 사용하면 훈련 작업에서 추출한 모델 출력 텐서를 시각화할 수 있습니다. 다양한 모델, 여러 번의 훈련 실행, 모델 하이퍼파라미터를 실험하면서 TensorBoard에서 여러 훈련 작업을 선택하고 한 곳에서 이들을 비교할 수 있습니다.

관리자용

SageMaker AI 콘솔 또는 SageMaker AI 도메인의 TensorBoard 랜딩 페이지를 통해 AWS 계정 또는 SageMaker AI 도메인의 관리자인 경우 TensorBoard 애플리케이션 사용자를 관리할 수 있습니다. 각 도메인 사용자는 부여된 권한이 주어지면 자신의 TensorBoard 애플리케이션에 액세스할 수 있습니다. SageMaker AI 도메인 관리자 및 도메인 사용자는 권한 수준을 고려하여 TensorBoard 애플리케이션을 생성하고 삭제할 수 있습니다.

참고

SageMaker AI 도메인은 사용자 간의 애플리케이션 공유를 허용하지 않으므로 협업 목적으로 TensorBoard 애플리케이션을 공유할 수 없습니다. 사용자는 버킷에 액세스할 수 있는 경우 S3 버킷에 저장된 출력 텐서를 공유할 수 있습니다.

지원되는 프레임워크 및 AWS 리전

SageMaker AI의 TensorBoard 애플리케이션은 다음 기계 학습 프레임워크 및에 사용할 수 있습니다 AWS 리전.

프레임워크
  • PyTorch

  • TensorFlow

  • Hugging Face 트랜스포머

AWS 리전
  • 미국 동부 (버지니아 북부) (us-east-1)

  • 미국 동부 (오하이오)(us-east-2)

  • 미국 서부 (오리건) (us-west-2)

  • EU (프랑크푸르트)(eu-central-1)

  • EU (아일랜드)(eu-west-1)

참고

TensorBoard를 사용하는 Amazon SageMaker AI는 ml.r5.large 인스턴스에서 실행되며 SageMaker AI 프리 티어 또는 기능의 무료 평가판 기간이 지나면 요금이 발생합니다. 자세한 내용은 Amazon SageMaker AI 요금을 참조하세요.