SageMaker 노트북 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SageMaker 노트북

Amazon SageMaker AI를 사용하여 JupyterLab 환경의 Jupyter 노트북에서 기계 학습 모델을 대화형으로 빌드, 훈련 및 배포할 수 있습니다. 하지만 노트북을 비대화형 예약 작업으로 실행해야 하는 다양한 시나리오가 있을 수 있습니다. 예를 들어, 특정 기간 동안 실행되는 모든 훈련 작업을 분석하고 이러한 모델을 프로덕션에 배포하는 데 따른 비즈니스 가치를 분석하는 정기 감사 보고서를 만들고자 할 수 있습니다. 또는 소량의 데이터에서 데이터 변환 로직을 테스트한 후 기능 엔지니어링 작업을 조정하고 싶을 수도 있습니다. 일반적인 사용 사례는 다음과 같습니다.

  • 모델 드리프트 모니터링을 위한 작업 스케줄링

  • 더 나은 모델을 위한 파라미터 공간 탐색

이러한 시나리오에서는 SageMaker 노트북 작업을 사용하여 비대화형 작업(SageMaker AI가 기본 훈련 작업으로 실행됨)을 생성하여 온디맨드 또는 일정에 따라 실행할 수 있습니다. SageMaker 노트북 작업은 직관적인 사용자 인터페이스를 제공하므로 노트북의 노트북 작업 위젯( Blue icon of a calendar with a checkmark, representing a scheduled task or event. )을 선택하여 JupyterLab에서 바로 작업을 예약할 수 있습니다. 파이프라인 워크플로에서 여러 노트북 작업을 유연하게 예약할 수 있는 SageMaker AI Python SDK를 사용하여 작업을 예약할 수도 있습니다. 여러 노트북을 병렬로 실행하고 노트북의 셀을 파라미터화하여 입력 파라미터를 사용자 지정할 수 있습니다.

이 기능은 Amazon EventBridge, SageMaker 훈련 및 Pipelines 서비스를 활용하며 다음과 같은 환경의 Jupyter Notebook에서 사용할 수 있습니다.

  • Studio, Studio Lab, Studio Classic 또는 노트북 인스턴스

  • 로컬 설정(예: JupyterLab을 실행하는 로컬 머신)

사전 조건

Notebook 작업을 예약하려면 다음 기준을 충족하는지 확인하세요.

  • Jupyter notebook과 모든 초기화 또는 시작 스크립트가 코드 및 소프트웨어 패키지와 관련하여 독립적인지 확인합니다. 그렇지 않으면 비대화형 작업에서 오류가 발생할 수 있습니다.

  • Jupyter notebook, 네트워크 설정 및 컨테이너 설정을 올바르게 구성했는지 제약 조건 및 고려 사항을 검토합니다.

  • 노트북이 Amazon EMR 클러스터와 같은 필요한 외부 리소스에 액세스할 수 있는지 확인합니다.

  • 로컬 Jupyter notebook에서 노트북 작업을 설정하는 경우 설치를 완료합니다. 지침은 설치 가이드섹션을 참조하세요.

  • 노트북의 Amazon EMR 클러스터에 연결하고 Amazon EMR 연결 명령을 파라미터화하려는 경우 환경 변수를 사용하여 파라미터를 전달하는 차선책을 적용해야 합니다. 세부 정보는 노트북에서 Amazon EMR 클러스터에 연결을 참조하세요.

  • Kerberos, LDAP 또는 HTTP Basic Auth 인증을 사용하여 Amazon EMR 클러스터에 연결하는 경우 AWS Secrets Manager 를 사용하여 보안 자격 증명을 Amazon EMR 연결 명령에 전달해야 합니다. 세부 정보는 노트북에서 Amazon EMR 클러스터에 연결을 참조하세요.

  • (선택 사항) 노트북을 시작할 때 UI가 스크립트를 미리 로드하여 실행되도록 하려면 관리자가 수명 주기 구성(LCC)을 사용하여 스크립트를 설치해야 합니다. LCC 스크립트 사용 방법에 대한 자세한 내용은 수명 주기 구성 스크립트를 사용한 노트북 인스턴스 사용자 지정을 참조하세요.