기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
노트북 인스턴스를 사용하여 모델 구축
기계 학습 (ML) 실무자가 SageMaker Amazon을 사용하는 가장 좋은 방법 중 하나는 SageMaker 노트북 인스턴스를 사용하여 ML 모델을 교육하고 배포하는 것입니다. SageMaker 노트북 인스턴스는 Amazon Elastic Compute Cloud (Amazon) 에서 Jupyter 서버를 시작하고 Amazon SageMaker PythonSDK,, (EC2), Conda, Pandas AWS SDK for Python (Boto3), AWS Command Line Interface 딥 러닝 프레임워크 라이브러리 및 기타 데이터 과학 및 기계 학습용 라이브러리 등의 패키지와 함께 사전 구성된 커널을 제공하여 환경을 조성하는 데 도움이 됩니다.AWS CLI
SageMaker Python을 사용한 기계 학습 SDK
SageMaker 노트북 인스턴스에서 ML 모델을 학습, 검증, 배포 및 평가하려면 SageMaker Python을 사용하십시오SDK. SageMaker Python SDK 추상 AWS SDK for Python (Boto3) 및 SageMaker API 연산. 이를 통해 데이터 및 모델 아티팩트를 저장하는 Amazon Simple Storage Service (Amazon S3), ML 모델을 가져오고 서비스하기 위한 Amazon Elastic Container Registry ECR (), 교육 및 추론을 위한 Amazon Elastic Compute Cloud (EC2Amazon) 와 같은 다른 AWS 서비스와 통합하고 오케스트레이션할 수 있습니다.
또한 데이터 레이블 지정, 데이터 사전 처리, 모델 교육, 모델 배포, 예측 성능 평가, 생산 중인 모델 품질 모니터링 등 전체 ML 주기의 모든 단계를 처리하는 데 도움이 되는 SageMaker 기능을 활용할 수 있습니다.
처음 사용하는 경우 end-to-end ML SageMaker 튜토리얼에 따라 SageMaker SDK Python을 사용하는 것이 좋습니다. 오픈 소스 설명서를 찾으려면 Amazon SageMaker Python을
자습서 개요
이 Get Started 자습서는 SageMaker 노트북 인스턴스를 생성하고, 기계 학습을 위한 Conda 환경에서 사전 구성된 커널이 있는 Jupyter 노트북을 열고, ML 사이클을 실행하기 위한 SageMaker 세션을 시작하는 방법을 안내합니다. end-to-end SageMaker세션과 자동으로 페어링되는 기본 Amazon S3 버킷에 데이터 세트를 저장하고, ML 모델의 교육 작업을 Amazon에 제출하고EC2, Amazon을 통한 호스팅 또는 일괄 추론을 통해 예측용으로 학습된 모델을 배포하는 방법을 알아봅니다. EC2
이 자습서에서는 내장된 XGBoost 모델 풀에서 모델을 학습하는 전체 ML 흐름을 명시적으로 보여줍니다. SageMaker 미국 성인 인구 조사 데이터세트를
-
SageMakerXGBoost— XGBoost
모델은 SageMaker 환경에 맞게 조정되고 Docker 컨테이너로 사전 구성되어 있습니다. SageMaker기능을 사용할 SageMaker 수 있도록 준비된 내장 알고리즘 제품군을 제공합니다. ML 알고리즘의 적용 범위에 대해 자세히 알아보려면 알고리즘 선택 및 Amazon SageMaker 내장 알고리즘 사용을 참조하십시오. SageMaker SageMaker 내장 알고리즘 API 작업에 대한 내용은 Amazon SageMaker SDK Python의 퍼스트 파티 알고리즘을 참조하십시오. -
성인 인구 조사 데이터 집합
- Ronny Kohavi와 Barry Becker(데이터 마이닝 및 시각화, Silicon Graphics)가 작성한1994년 인구조사국 데이터베이스 의 데이터 집합입니다. SageMaker XGBoost모델은 이 데이터세트를 사용하여 개인의 연간 수입이 50,000달러 이상인지 또는 그 이하인지 예측하도록 훈련됩니다.