Canvas のサンプルデータセット - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Canvas のサンプルデータセット

SageMaker Canvas は、一意のユースケースに対応するサンプルデータセットを提供するため、コードを記述することなくモデルの構築、トレーニング、検証を迅速に開始できます。これらのデータセットに関連付けられたユースケースでは、 SageMaker Canvas の機能に焦点を当てており、これらのデータセットを活用してモデルの構築を開始できます。サンプルデータセットは SageMaker 、Canvas アプリケーションのデータセットページにあります。

次のデータセットは、Canvas SageMaker がデフォルトで提供するサンプルです。これらのデータセットは、住宅価格、債務不履行、糖尿病患者の再入院の予測、売上予測、製造部門の予知保全を効率化するための機械故障予測、輸送と物流のサプライチェーン予測の生成などのユースケースを対象としています。データセットは、リージョンのアカウント用に SageMaker が作成するデフォルトの Amazon S3 バケットのsample_datasetフォルダに保存されます。

  • canvas-sample-diabetic-readmission.csv: このデータセットには、患者と病院の結果を含む 15 を超える機能を含む履歴データが含まれています。このデータセットを使用して、高リスクの糖尿病患者が退院後 30 日以内に再入院するか、30 日後に再入院するか、あるいはまったく入院しないかを予測できます。redadmitted 列をターゲット列として使用して、このデータセットでは 3+ カテゴリ予測モデルタイプを使用します。このデータセットを使用してモデルを構築する方法の詳細については、SageMaker Canvas ワークショップページ を参照してください。このデータセットはUCIMachine Learningリポジトリ から取得されました。

  • canvas-sample-housing.csv: このデータセットには、特定の住宅価格に関連付けられた特性に関するデータが含まれています。このデータセットを使用して住宅価格を予測できます。median_house_value 列をターゲット列として使用し、このデータセットで数値予測モデルタイプを使用します。このデータセットを使用してモデルを構築する方法の詳細については、SageMaker Canvas ワークショップページ を参照してください。これは、StatLib リポジトリ から取得した California ハウジングデータセットです。

  • canvas-sample-loans.csv: このデータセットには、現在のローンステータスと最新の支払い情報を含む、2007~2011 年に発行されたすべてのローンの完全なローンデータが含まれています。このデータセットを使用して、顧客がローンを返済するかどうかを予測できます。loan_status 列をターゲット列として使用して、このデータセットでは 3+ カテゴリ予測モデルタイプを使用します。このデータセットを使用してモデルを構築する方法の詳細については、SageMaker Canvas ワークショップページ を参照してください。このデータは、Kaggle から取得した LendingClub データを使用します。

  • canvas-sample-maintenance.csv: このデータセットには、特定のメンテナンス障害タイプに関連付けられた特性に関するデータが含まれています。このデータセットを使用して、将来どの障害が発生するかを予測できます。Failure Type 列をターゲット列として使用して、このデータセットでは 3+ カテゴリ予測モデルタイプを使用します。このデータセットを使用してモデルを構築する方法の詳細については、SageMaker Canvas ワークショップページ を参照してください。このデータセットはUCIMachine Learningリポジトリ から取得されました。

  • canvas-sample-shipping-logs.csv: このデータセットには、配送の推定時間優先度、配送業者、オリジンなど、配送されたすべての製品の完全な配送データが含まれています。このデータセットを使用して、荷物の到着予定日数を予測できます。ActualShippingDays 列をターゲット列として使用し、このデータセットで数値予測モデルタイプを使用します。このデータを使用してモデルを構築する方法の詳細については、SageMaker Canvas ワークショップページ を参照してください。これは Amazon が作成した合成データセットです。

  • canvas-sample-sales-forecasting.csv: このデータセットには、小売店の時系列の売上履歴データが含まれています。このデータセットを使用して、特定の小売店の売上を予測できます。売上列をターゲット列として使用し、このデータセットで時系列予測モデルタイプを使用します。このデータセットを使用してモデルを構築する方法の詳細については、SageMaker Canvas ワークショップページ を参照してください。これは Amazon が作成した合成データセットです。