기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SageMaker 노트북 작업
Amazon SageMaker 을 사용하여 모든 JupyterLab 환경에서 Jupyter 노트북에서 기계 학습 모델을 대화형으로 빌드, 훈련 및 배포할 수 있습니다. 하지만 노트북을 비대화형 예약 작업으로 실행해야 하는 다양한 시나리오가 있을 수 있습니다. 예를 들어, 특정 기간 동안 실행되는 모든 훈련 작업을 분석하고 이러한 모델을 프로덕션에 배포하는 데 따른 비즈니스 가치를 분석하는 정기 감사 보고서를 만들고자 할 수 있습니다. 또는 소량의 데이터에서 데이터 변환 로직을 테스트한 후 기능 엔지니어링 작업을 조정하고 싶을 수도 있습니다. 일반적인 사용 사례는 다음과 같습니다.
-
모델 드리프트 모니터링을 위한 작업 스케줄링
-
더 나은 모델을 위한 파라미터 공간 탐색
이러한 시나리오에서는 SageMaker 노트북 작업을 사용하여 비 대화형 작업(기본 훈련 작업으로 SageMaker 실행됨)을 생성하여 온디맨드 또는 일정에 따라 실행할 수 있습니다. SageMaker 노트북 작업은 노트북 작업 위젯( )을 JupyterLab 선택하여 에서 바로 작업을 예약할 수 있는 직관적인 사용자 인터페이스를 제공합니다. 파이프라인 워크플로에서 여러 노트북 작업을 예약할 수 SDK있는 유연성을 제공하는 SageMaker Python을 사용하여 작업을 예약할 수도 있습니다. 여러 노트북을 병렬로 실행하고 노트북의 셀을 파라미터화하여 입력 파라미터를 사용자 지정할 수 있습니다.
이 기능은 Amazon EventBridge, SageMaker Training 및 Pipelines 서비스를 활용하며 다음 환경 중 하나에서 Jupyter 노트북에서 사용할 수 있습니다.
-
Studio, Studio Lab, Studio Classic 또는 노트북 인스턴스
-
실행 중인 로컬 시스템과 같은 로컬 설정 JupyterLab
사전 조건
Notebook 작업을 예약하려면 다음 기준을 충족하는지 확인하세요.
-
Jupyter notebook과 모든 초기화 또는 시작 스크립트가 코드 및 소프트웨어 패키지와 관련하여 독립적인지 확인합니다. 그렇지 않으면 비대화형 작업에서 오류가 발생할 수 있습니다.
-
Jupyter notebook, 네트워크 설정 및 컨테이너 설정을 올바르게 구성했는지 제약 조건 및 고려 사항을 검토합니다.
-
노트북이 Amazon EMR 클러스터와 같은 필요한 외부 리소스에 액세스할 수 있는지 확인합니다.
-
로컬 Jupyter notebook에서 노트북 작업을 설정하는 경우 설치를 완료합니다. 지침은 설치 가이드 단원을 참조하십시오.
-
노트북의 Amazon EMR 클러스터에 연결하고 Amazon EMR 연결 명령을 파라미터화하려면 환경 변수를 사용하여 해결 방법을 적용하여 파라미터를 전달해야 합니다. 세부 정보는 노트북에서 Amazon EMR 클러스터에 연결을 참조하세요.
-
Kerberos, LDAP또는 HTTP Basic Auth 인증을 사용하여 Amazon EMR 클러스터에 연결하는 경우 AWS Secrets Manager 를 사용하여 보안 자격 증명을 Amazon EMR 연결 명령에 전달해야 합니다. 세부 정보는 노트북에서 Amazon EMR 클러스터에 연결을 참조하세요.
-
(선택 사항) 노트북 시작 시 UI가 실행되도록 스크립트를 미리 로드하려면 관리자가 수명 주기 구성()으로 스크립트를 설치해야 합니다LCC. LCC 스크립트를 사용하는 방법에 대한 자세한 내용은 수명 주기 구성 스크립트를 사용하여 노트북 인스턴스 사용자 지정을 참조하세요.