SageMaker 노트북 작업 - 아마존 SageMaker

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SageMaker 노트북 작업

SageMaker Amazon을 사용하면 어떤 환경에서든 Jupyter 노트북으로 기계 학습 모델을 대화식으로 구축, 교육 및 배포할 수 있습니다. JupyterLab 하지만 노트북을 비대화형 예약 작업으로 실행해야 하는 다양한 시나리오가 있을 수 있습니다. 예를 들어, 특정 기간 동안 실행되는 모든 훈련 작업을 분석하고 이러한 모델을 프로덕션에 배포하는 데 따른 비즈니스 가치를 분석하는 정기 감사 보고서를 만들고자 할 수 있습니다. 또는 소량의 데이터에서 데이터 변환 로직을 테스트한 후 기능 엔지니어링 작업을 조정하고 싶을 수도 있습니다. 일반적인 사용 사례는 다음과 같습니다.

  • 모델 드리프트 모니터링을 위한 작업 스케줄링

  • 더 나은 모델을 위한 파라미터 공간 탐색

이러한 시나리오에서는 SageMaker Notebook Jobs를 사용하여 비대화형 작업 (기본 교육 작업으로 SageMaker 실행) 을 생성하여 온디맨드 또는 일정에 따라 실행할 수 있습니다. SageMaker 노트북 작업은 직관적인 사용자 인터페이스를 제공하므로 노트북의 노트북 작업 위젯 ( Blue icon of a calendar with a checkmark, representing a scheduled task or event. ) 을 JupyterLab 선택하여 바로 작업을 예약할 수 있습니다. 파이프라인 워크플로우에서 여러 노트북 작업을 유연하게 예약할 수 있는 SageMaker SDK Python을 사용하여 작업을 예약할 수도 있습니다. 여러 노트북을 병렬로 실행하고 노트북의 셀을 파라미터화하여 입력 파라미터를 사용자 지정할 수 있습니다.

이 기능은 Amazon EventBridge, SageMaker Training 및 SageMaker Pipelines 서비스를 활용하며 다음과 같은 환경에서 Jupyter 노트북에서 사용할 수 있습니다.

  • 스튜디오, 스튜디오 랩, 스튜디오 클래식 또는 노트북 인스턴스

  • 로컬 설정 (예: 로컬 컴퓨터, 실행 위치) JupyterLab

사전 조건

Notebook 작업을 예약하려면 다음 기준을 충족하는지 확인하세요.

  • Jupyter notebook과 모든 초기화 또는 시작 스크립트가 코드 및 소프트웨어 패키지와 관련하여 독립적인지 확인합니다. 그렇지 않으면 비대화형 작업에서 오류가 발생할 수 있습니다.

  • Jupyter notebook, 네트워크 설정 및 컨테이너 설정을 올바르게 구성했는지 제약 조건 및 고려 사항을 검토합니다.

  • 노트북이 Amazon EMR 클러스터와 같은 필요한 외부 리소스에 액세스할 수 있는지 확인하십시오.

  • 로컬 Jupyter notebook에서 노트북 작업을 설정하는 경우 설치를 완료합니다. 지침은 설치 가이드 단원을 참조하십시오.

  • 노트북의 Amazon EMR 클러스터에 연결하고 Amazon EMR 연결 명령을 매개 변수화하려는 경우 매개 변수를 전달하기 위해 환경 변수를 사용하여 해결 방법을 적용해야 합니다. 세부 정보는 노트북에서 Amazon EMR 클러스터에 연결을 참조하세요.

  • Kerberos 또는 HTTP 기본 인증 인증을 사용하여 Amazon EMR 클러스터에 연결하는 경우 를 사용하여 Amazon EMR 연결 명령에 보안 자격 증명을 AWS Secrets Manager 전달해야 합니다. LDAP 세부 정보는 노트북에서 Amazon EMR 클러스터에 연결을 참조하세요.

  • (선택 사항) 노트북 시작 시 UI가 스크립트를 미리 로드하여 실행되도록 하려면 관리자가 수명 주기 구성 () 을 사용하여 스크립트를 설치해야 합니다. LCC 스크립트 사용 방법에 대한 자세한 내용은 수명 주기 구성 LCC 스크립트를 사용한 노트북 인스턴스 사용자 지정을 참조하십시오.