기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
모델 성능 디버깅 및 개선
기계 학습 모델, 딥 러닝 신경망, 변환기 모델의 핵심은 안정적인 모델 융합을 달성하는 데 있으며, state-of-the-art 따라서 모델에는 수백만, 수십억 또는 수조 개의 모델 파라미터가 있습니다. 매번 반복할 때마다 엄청난 수의 모델 파라미터를 업데이트하는 작업의 수는 쉽게 천문학적으로 많아질 수 있습니다. 모델 수렴 문제를 파악하려면 최적화 프로세스 중에 계산된 모델 매개변수, 활성화 및 기울기에 액세스할 수 있어야 합니다.
Amazon SageMaker 은 이러한 수렴 문제를 식별하고 모델에 대한 가시성을 얻는 데 도움이 되는 두 가지 디버깅 도구를 제공합니다.
Amazon SageMaker with TensorBoard
훈련 플랫폼 내의 오픈 소스 커뮤니티 도구와 더 큰 호환성을 SageMaker 제공하기 위해 는 SageMaker 도메인 의 애플리케이션 TensorBoard 으로 SageMaker 호스팅합니다. 훈련 작업을 로 가져오 SageMaker 고 TensorBoard 요약 작성기를 계속 사용하여 모델 출력 텐서를 수집할 수 있습니다. TensorBoard 는 SageMaker 도메인 에 구현되므로 AWS 계정의 SageMaker 도메인에서 사용자 프로파일을 관리할 수 있는 더 많은 옵션을 제공하고 특정 작업 및 리소스에 대한 액세스 권한을 부여하여 사용자 프로파일을 미세하게 제어할 수 있습니다. 자세한 내용은 TensorBoard Amazon에서 SageMaker을 참조하십시오.
Amazon SageMaker 디버거
Amazon SageMaker Debugger는 콜백에 후크를 등록하여 모델 출력 텐서를 추출하고 Amazon Simple Storage Service에 저장하는 도구를 SageMaker 제공하는 기능입니다. 과적합, 포화 활성화 함수, 기울기 소실 등과 같은 모델 수렴 문제를 감지하기 위한 내장 규칙 제공합니다. 또한 Amazon CloudWatch Events 및 를 사용하여 감지된 문제에 대한 자동 작업을 수행하기 AWS Lambda 위한 기본 제공 규칙을 설정하고 이메일 또는 문자 알림을 수신하도록 Amazon Simple Notification Service를 설정할 수 있습니다. 자세한 내용은 Amazon SageMaker 디버거을 참조하십시오.