기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SageMaker Canvas는 코드를 작성하지 않고도 모델 구축, 훈련 및 검증을 빠르게 시작할 수 있도록 고유한 사용 사례를 다루는 샘플 데이터세트를 제공합니다. 이러한 데이터세트와 관련된 사용 사례는 SageMaker Canvas의 기능을 강조하며, 이러한 데이터세트를 활용하여 모델 구축을 시작할 수 있습니다. SageMaker Canvas 애플리케이션의 데이터세트 페이지에서 샘플 데이터세트를 찾을 수 있습니다.
다음 데이터세트는 SageMaker Canvas에서 기본적으로 제공하는 샘플입니다. 이 데이터세트는 주택 가격, 대출 채무 불이행 및 당뇨병 환자의 재입원 예측, 판매 예측, 제조 단위의 예측 유지보수를 간소화하기 위한 기계 고장 예측, 운송 및 물류를 위한 공급망 예측 생성 등의 사용 사례를 다룹니다. 데이터 세트는 SageMaker AI가 리전의 계정에 대해 생성하는 기본 Amazon S3 버킷의 sample_dataset
폴더에 저장됩니다.
-
canvas-sample-diabetic-readmission.csv: 이 데이터세트에는 환자 및 병원 결과와 관련된 15개 이상의 기능을 포함한 과거 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 고위험 당뇨병 환자가 퇴원 후 30일 이내에 병원에 재입원할 가능성이 있는지, 30일 후 또는 전혀 재입원할 가능성이 있는지 예측할 수 있습니다. 재입원 열을 대상 열로 사용하고, 이 데이터세트에는 3개 이상의 범주 예측 모델 유형을 사용하세요. 이 데이터 세트를 사용하여 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지
를 참조하세요. 이 데이터 세트는 UCI 기계 학습 리포지토리 에서 가져온 것입니다. -
canvas-sample-housing.csv: 이 데이터세트에는 특정 주택 가격과 관련된 특성에 대한 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 주택 가격을 예측할 수 있습니다. median_house_value 열을 대상 열로 사용하고 이 데이터세트에는 수치 예측 모델 유형을 사용하세요. 이 데이터세트로 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지
를 참조하세요. 이는 StatLib 리포지토리 에서 가져온 캘리포니아 주택 데이터세트입니다. -
canvas-sample-loans.csv: 이 데이터세트에는 현재 대출 상태 및 최근 결제 정보를 포함하여 2007년부터 2011년까지 발행된 모든 대출에 대한 전체 대출 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 고객의 대출금 상환 여부를 예측할 수 있습니다. loan_status 열을 대상 열로 사용하고, 이 데이터세트에는 3개 이상의 범주 예측 모델 유형을 사용하세요. 이 데이터 세트를 사용하여 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지
를 참조하세요. 이 데이터는 Kaggle 에서 얻은 LendingClub 데이터를 사용합니다. -
canvas-sample-maintenance.csv: 이 데이터세트에는 특정 유지보수 실패 유형과 관련된 특성에 대한 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 미래에 어떤 장애가 발생할지 예측할 수 있습니다. 실패 유형 열을 대상 열로 사용하고 이 데이터세트에는 3개 이상의 범주 예측 모델 유형을 사용하세요. 이 데이터 세트를 사용하여 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지
를 참조하세요. 이 데이터 세트는 UCI 기계 학습 리포지토리 에서 가져온 것입니다. -
canvas-sample-shipping-logs.csv: 이 데이터세트에는 예상 배송 시간, 배송 우선순위, 배송사, 출발지를 포함하여 배송된 모든 제품에 대한 전체 배송 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 배송 예상 도착 시간(일수)을 예측할 수 있습니다. ActualShippingDays 열을 대상 열로 사용하고 이 데이터세트에는 수치 예측 모델 유형을 사용하세요. 이 데이터를 사용하여 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지
를 참조하세요. 이것은 Amazon에서 만든 합성 데이터 세트입니다. -
canvas-sample-sales-forecasting.csv: 이 데이터세트에는 소매점의 과거 시계열 판매 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 특정 소매점의 매출을 예측할 수 있습니다. 판매 열을 대상 열로 사용하고 이 데이터세트에는 시계열 예측 모델 유형을 사용합니다. 이 데이터 세트를 사용하여 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지
를 참조하세요. 이것은 Amazon에서 만든 합성 데이터 세트입니다.