쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

Canvas의 샘플 데이터세트

포커스 모드
Canvas의 샘플 데이터세트 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SageMaker Canvas는 코드를 작성하지 않고도 모델 구축, 훈련 및 검증을 빠르게 시작할 수 있도록 고유한 사용 사례를 다루는 샘플 데이터세트를 제공합니다. 이러한 데이터세트와 관련된 사용 사례는 SageMaker Canvas의 기능을 강조하며, 이러한 데이터세트를 활용하여 모델 구축을 시작할 수 있습니다. SageMaker Canvas 애플리케이션의 데이터세트 페이지에서 샘플 데이터세트를 찾을 수 있습니다.

다음 데이터세트는 SageMaker Canvas에서 기본적으로 제공하는 샘플입니다. 이 데이터세트는 주택 가격, 대출 채무 불이행 및 당뇨병 환자의 재입원 예측, 판매 예측, 제조 단위의 예측 유지보수를 간소화하기 위한 기계 고장 예측, 운송 및 물류를 위한 공급망 예측 생성 등의 사용 사례를 다룹니다. 데이터 세트는 SageMaker AI가 리전의 계정에 대해 생성하는 기본 Amazon S3 버킷의 sample_dataset 폴더에 저장됩니다.

  • canvas-sample-diabetic-readmission.csv: 이 데이터세트에는 환자 및 병원 결과와 관련된 15개 이상의 기능을 포함한 과거 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 고위험 당뇨병 환자가 퇴원 후 30일 이내에 병원에 재입원할 가능성이 있는지, 30일 후 또는 전혀 재입원할 가능성이 있는지 예측할 수 있습니다. 재입원 열을 대상 열로 사용하고, 이 데이터세트에는 3개 이상의 범주 예측 모델 유형을 사용하세요. 이 데이터 세트를 사용하여 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지를 참조하세요. 이 데이터 세트는 UCI 기계 학습 리포지토리에서 가져온 것입니다.

  • canvas-sample-housing.csv: 이 데이터세트에는 특정 주택 가격과 관련된 특성에 대한 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 주택 가격을 예측할 수 있습니다. median_house_value 열을 대상 열로 사용하고 이 데이터세트에는 수치 예측 모델 유형을 사용하세요. 이 데이터세트로 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지를 참조하세요. 이는 StatLib 리포지토리에서 가져온 캘리포니아 주택 데이터세트입니다.

  • canvas-sample-loans.csv: 이 데이터세트에는 현재 대출 상태 및 최근 결제 정보를 포함하여 2007년부터 2011년까지 발행된 모든 대출에 대한 전체 대출 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 고객의 대출금 상환 여부를 예측할 수 있습니다. loan_status 열을 대상 열로 사용하고, 이 데이터세트에는 3개 이상의 범주 예측 모델 유형을 사용하세요. 이 데이터 세트를 사용하여 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지를 참조하세요. 이 데이터는 Kaggle에서 얻은 LendingClub 데이터를 사용합니다.

  • canvas-sample-maintenance.csv: 이 데이터세트에는 특정 유지보수 실패 유형과 관련된 특성에 대한 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 미래에 어떤 장애가 발생할지 예측할 수 있습니다. 실패 유형 열을 대상 열로 사용하고 이 데이터세트에는 3개 이상의 범주 예측 모델 유형을 사용하세요. 이 데이터 세트를 사용하여 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지를 참조하세요. 이 데이터 세트는 UCI 기계 학습 리포지토리에서 가져온 것입니다.

  • canvas-sample-shipping-logs.csv: 이 데이터세트에는 예상 배송 시간, 배송 우선순위, 배송사, 출발지를 포함하여 배송된 모든 제품에 대한 전체 배송 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 배송 예상 도착 시간(일수)을 예측할 수 있습니다. ActualShippingDays 열을 대상 열로 사용하고 이 데이터세트에는 수치 예측 모델 유형을 사용하세요. 이 데이터를 사용하여 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지를 참조하세요. 이것은 Amazon에서 만든 합성 데이터 세트입니다.

  • canvas-sample-sales-forecasting.csv: 이 데이터세트에는 소매점의 과거 시계열 판매 데이터가 포함되어 있습니다. 이 데이터세트를 사용하여 특정 소매점의 매출을 예측할 수 있습니다. 판매 열을 대상 열로 사용하고 이 데이터세트에는 시계열 예측 모델 유형을 사용합니다. 이 데이터 세트를 사용하여 모델을 구축하는 방법에 대해 자세히 알아보려면 SageMaker Canvas 워크숍 페이지를 참조하세요. 이것은 Amazon에서 만든 합성 데이터 세트입니다.

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.