수명 주기 구성 디버깅 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

수명 주기 구성 디버깅

다음 주제에서는 수명 주기 구성에 대한 정보를 얻고 디버깅하는 방법을 보여줍니다.

CloudWatch Logs에서 수명 주기 구성 프로세스 확인

수명 주기 구성은 STDOUTSTDERR만 기록합니다.

STDOUT는 bash 스크립트의 기본 출력입니다. bash 명령어 끝에 >&2를 추가하여 STDERR에 쓸 수 있습니다. 예: echo 'hello'>&2.

수명 주기 구성 로그는 Amazon CloudWatch를 사용하여 AWS 계정에 게시됩니다. 이러한 로그는 CloudWatch 콘솔의 /aws/sagemaker/studio로그 스트림에서 찾을 수 있습니다.

  1. https://console.aws.amazon.com/cloudwatch/에서 CloudWatch 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 작업을 선택합니다. 드롭다운 메뉴에서 로그 그룹을 선택합니다.

  3. 로그 그룹 페이지에서 aws/sagemaker/studio를 검색합니다.

  4. 로그 그룹을 선택합니다.

  5. 로그 그룹 세부 정보 페이지에서 로그 스트림 탭을 선택합니다.

  6. 특정 앱의 로그를 찾으려면 다음 형식을 사용하여 로그 스트림을 검색하세요.

    domain-id/user-profile-name/app-type/app-name

    다음 검색 문자열은 예를 들어 도메인 d-m85lcu8vbqmz, 사용자 프로필 i-sonic-js, 애플리케이션 유형 JupyterLab, 애플리케이션 이름 test-lcc-echo에 대한 수명 주기 구성 로그를 찾습니다.

    d-m85lcu8vbqmz/i-sonic-js/JupyterLab/test-lcc-echo
  7. 스크립트 실행 로그를 보려면 LifecycleConfigOnStart가 추가된 로그 스트림을 선택합니다.

수명 주기 구성의 제한 시간

수명 주기 구성 시간 초과 제한은 5분입니다. 수명 주기 구성 스크립트를 실행하는 데 5분 이상 걸리는 경우 오류가 발생합니다.

이 오류를 해결하려면 수명 주기 구성 스크립트가 5분 이내에 완료되어야 합니다.

스크립트 실행 시간을 줄이기 위해 다음을 시도할 수 있습니다.

  • 불필요한 단계를 줄입니다. 예를 들어 대규모 패키지를 설치할 conda 환경을 제한합니다.

  • 작업을 병렬 프로세스로 실행합니다.

  • 스크립트의 nohup 명령을 사용하여 중단 신호는 무시하여 스크립트가 중지 없이 실행되도록 합니다.