Canvas 中的範例資料集 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

Canvas 中的範例資料集

SageMaker Canvas 提供範例資料集來解決獨特的使用案例,因此您可以快速開始建置、訓練和驗證模型,而無需撰寫任何程式碼。與這些資料集相關聯的使用案例強調 SageMaker Canvas 的功能,您可以利用這些資料集來開始使用建置模型。您可以在 SageMaker Canvas 應用程式的資料集頁面中找到範例資料集

下列資料集是 SageMaker Canvas 預設提供的範例。這些資料集涵蓋使用案例,例如預測房價、貸款違約以及預測糖尿病患者再住院率、預測銷售、預測機器故障以簡化製造單位的預測性維護,以及產生運輸和物流的供應鏈預測。資料集會儲存在預設 Amazon S3 儲存貯體的sample_dataset資料夾中,該儲存貯體為 區域中的帳戶 SageMaker 建立。

  • canvas-sample-diabetic-readmission.csv:此資料集包含歷史資料,包括超過 15 個具有患者和醫院結果的功能。您可以使用此資料集來預測高風險糖尿病患者是否有可能在出院 30 天內、30 天後入院或不再入院。使用 redadmitted 資料欄做為目標欄,並在此資料集中使用 3+ 類別預測模型類型。若要進一步了解如何使用此資料集建置模型,請參閱 SageMaker Canvas 研討會頁面 。此資料集是從 UCI Machine Learning 儲存庫 取得。

  • canvas-sample-housing.csv:此資料集包含與指定住房價格綁定的特徵資料。您可以使用此資料集來預測房價。使用 median_house_value 欄作為目標欄,並將數值預測模型類型與此資料集搭配使用。若要進一步了解如何使用此資料集建置模型,請參閱 SageMaker Canvas 研討會頁面 。這是從StatLib 儲存庫 取得的加州住房資料集。

  • canvas-sample-loans.csv:此資料集包含 2007 年至 2011 年間發行的所有貸款的完整貸款資料,包括目前的貸款狀態和最新的付款資訊。您可以使用此資料集來預測客戶是否會償還貸款。使用 loan_status 資料欄做為目標欄,並在此資料集中使用 3+ 類別預測模型類型。若要進一步了解如何使用此資料集建置模型,請參閱 SageMaker Canvas 研討會頁面 。此資料使用從 Kaggle 取得 LendingClub 的資料。

  • canvas-sample-maintenance.csv:此資料集包含與指定維護失敗類型綁定的特徵資料。您可以使用此資料集來預測未來會發生哪些失敗。使用失敗類型資料欄做為目標欄,並在此資料集中使用 3+ 類別預測模型類型。若要進一步了解如何使用此資料集建置模型,請參閱 SageMaker Canvas 研討會頁面 。此資料集是從 UCI Machine Learning 儲存庫 取得。

  • canvas-sample-shipping-logs.csv:此資料集包含所有交付產品的完整寄件資料,包括預估的寄件優先順序、運輸業者和原始伺服器。您可以使用此資料集來預測運送的預計送達天數時間。使用 ActualShippingDays欄作為目標欄,並將數值預測模型類型與此資料集搭配使用。若要進一步了解如何使用此資料建置模型,請參閱 SageMaker Canvas 研討會頁面 。這是 Amazon 建立的合成資料集。

  • canvas-sample-sales-forecasting.csv:此資料集包含零售商店的歷史時間序列銷售資料。您可以使用此資料集來預測特定零售商店的銷售額。使用銷售資料欄作為目標資料欄,並將時間序列預測模型類型與此資料集搭配使用。若要進一步了解如何使用此資料集建置模型,請參閱 SageMaker Canvas 研討會頁面 。這是 Amazon 建立的合成資料集。