ノートブックインスタンスを使用してモデルを構築するためのチュートリアル
この開始方法のチュートリアルでは、SageMaker ノートブックインスタンスの作成方法、機械学習用に Conda 環境で事前設定されたカーネルで Jupyter ノートブックを開く方法、エンドツーエンドの機械学習サイクルを実行するための SageMaker セッションの開始方法について説明します。SageMaker セッションと自動的にペアリングされたデフォルトの Amazon S3 バケットにデータセットを保存する方法、機械学習モデルのトレーニングジョブを Amazon EC2 に送信する方法、ホスティングまたはバッチ推論で予測用にトレーニングされたモデルを Amazon EC2 を介してデプロイする方法を学習します。
このチュートリアルでは、SageMaker 組み込みモデルプールから XGBoost モデルをトレーニングする詳細な機械学習フローをわかりやすく紹介します。米国成人国勢調査データセット
-
SageMaker XGBoost – XGBoost
モデルは SageMaker 環境に適合し、Docker コンテナとして事前設定されています。SageMaker は、SageMaker の機能の使用に対応した一連の組み込みアルゴリズムを提供しています。SageMaker に適応した機械学習アルゴリズムの詳細については、「Choose an Algorithm」と「Use Amazon SageMaker Built-in Algorithms」を参照してください。SageMaker 組み込みアルゴリズム API のオペレーションについては、「Amazon SageMaker Python SDK 」の「ファーストパーティアルゴリズム 」を参照してください。 -
成人国勢調査データセット
- Ronny Kohavi 氏と Barry Becker 氏による 1994 年国勢調査局データベース からのデータセットです (Data Mining and Visualization、Silicon Graphics)。SageMaker XGBoost モデルはこのデータセットを使用してトレーニングされており、個人の年間所得が 50,000 USD 以下になるかどうかを予測します。