수명 주기 구성 디버깅 - Amazon SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

수명 주기 구성 디버깅

중요

2023년 11월 30일부터 이전 Amazon SageMaker Studio 환경이 이제 Amazon SageMaker Studio Classic으로 명명되었습니다. 다음 섹션은 Studio Classic 애플리케이션 사용에 적용됩니다. 업데이트된 Studio 환경 사용에 대한 자세한 내용은 섹션을 참조하세요Amazon SageMaker Studio.

다음 주제에서는 수명 주기 구성에 대한 정보를 얻고 디버깅하는 방법을 보여줍니다.

CloudWatch Logs에서 수명 주기 구성 프로세스 확인

수명 주기 구성은 STDOUTSTDERR만 기록합니다.

STDOUT는 bash 스크립트의 기본 출력입니다. bash 명령어 끝에 >&2를 추가하여 STDERR에 쓸 수 있습니다. 예: echo 'hello'>&2.

수명 주기 구성에 대한 로그는 Amazon 를 AWS 계정 사용하여 에 게시됩니다 CloudWatch. 이러한 로그는 CloudWatch 콘솔의 /aws/sagemaker/studio 로그 스트림에서 찾을 수 있습니다.

  1. 에서 CloudWatch 콘솔을 엽니다https://console.aws.amazon.com/cloudwatch/.

  2. 왼쪽에서 로그를 선택합니다. 드롭다운 메뉴에서 로그 그룹을 선택합니다.

  3. 로그 그룹 페이지에서 aws/sagemaker/studio를 검색합니다.

  4. 로그 그룹을 선택합니다.

  5. 로그 그룹 세부 정보 페이지에서 로그 스트림 탭을 선택합니다.

  6. 특정 앱의 로그를 찾으려면 다음 형식을 사용하여 로그 스트림을 검색하세요.

    domain-id/user-profile-name/app-type/app-name

    예를 들어 도메인 d-m85lcu8vbqmz, 사용자 프로필 i-sonic-js, 애플리케이션 유형 JupyterServer, 애플리케이션 이름 test-lcc-echo에 대한 수명 주기 구성 로그를 찾으려면 다음 검색 문자열을 사용하세요.

    d-m85lcu8vbqmz/i-sonic-js/JupyterServer/test-lcc-echo
  7. LifecycleConfigOnStart가 추가된 로그 스트림을 선택하면 스크립트 실행 로그를 볼 수 있습니다.

JupyterServer 앱 실패

연결된 수명 주기 구성 문제로 인해 JupyterServer 앱이 충돌하는 경우 Studio Classic 시작 화면에 Studio Classic에 다음 오류 메시지가 표시됩니다.

Failed to create SageMaker Studio due to start-up script failure

View script logs 링크를 선택하여 JupyterServer 앱의 CloudWatch 로그를 봅니다.

도메인, 사용자 프로필 또는 공유 공간DefaultResourceSpec의 에 잘못된 수명 주기 구성이 지정된 경우 Studio Classic은 Studio Classic을 다시 시작한 후에도 수명 주기 구성을 계속 사용합니다.

이 오류를 해결하려면 기본 수명 주기 구성 설정의 단계에 따라 DefaultResourceSpec에서 수명 주기 구성 스크립트를 제거하거나 다른 스크립트를 기본값으로 선택하세요. 그런 다음 새 JupyterServer 앱을 시작합니다.

KernelGateway 앱 실패

연결된 수명 주기 구성의 문제로 인해 KernelGateway 앱이 충돌하는 경우 Studio Classic은 Studio Classic 노트북에 오류 메시지를 표시합니다.

앱의 CloudWatch 로그View script logs KernelGateway를 보려면 선택합니다.

이 경우 새 Studio Classic 노트북을 시작할 때 Studio Classic Launcher에 수명 주기 구성이 지정됩니다.

이 오류를 해결하려면 Studio Classic 시작 관리자를 사용하여 다른 수명 주기 구성을 선택하거나 를 선택합니다No script.

참고

에 지정된 기본 KernelGateway 수명 주기 구성은 사용자가 Studio Classic 시작 관리자에 표시된 목록에서 다른 스크립트를 선택하지 않는 한 도메인, 사용자 프로필 또는 공유 공간의 모든 KernelGateway 이미지에 DefaultResourceSpec 적용됩니다. 사용자가 No Script를 선택한 경우 기본 스크립트도 실행됩니다. 스크립트 선택에 대한 자세한 내용은 3단계: 수명 주기 구성으로 애플리케이션 시작를 참조하세요.

수명 주기 구성의 제한 시간

수명 주기 구성 시간 초과 제한은 5분입니다. 수명 주기 구성 스크립트를 실행하는 데 5분 이상 걸리면 Studio Classic에서 오류가 발생합니다.

이 오류를 해결하려면 수명 주기 구성 스크립트가 5분 이내에 완료되어야 합니다.

스크립트 실행 시간을 줄이기 위해 다음을 시도할 수 있습니다.

  • 필요한 단계를 줄입니다. 예를 들어 대규모 패키지를 설치할 conda 환경을 제한합니다.

  • 작업을 병렬 프로세스로 실행합니다.

  • 끊기 신호가 무시되고 스크립트 실행이 중단되지 않도록 하려면 스크립트에서 nohup명령을 사용하세요.