翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
この入門チュートリアルでは、SageMaker ノートブックインスタンスを作成し、機械学習用の Conda 環境で事前設定されたカーネルを持つ Jupyter Notebook を開き、SageMaker AI セッションを開始してend-to-end ML サイクルを実行する方法について説明します。SageMaker AI セッションと自動的にペアになったデフォルトの Amazon S3 バケットにデータセットを保存し、ML モデルのトレーニングジョブを Amazon EC2 に送信し、Amazon EC2 を介してホスティングまたはバッチ推論を行うことで、トレーニング済みモデルを予測用にデプロイする方法について説明します。
このチュートリアルでは、SageMaker AI 組み込みモデルプールから XGBoost モデルをトレーニングする完全な ML フローを明示的に示します。米国成人国勢調査データセット
-
SageMaker AI XGBoost – XGBoost
モデルは SageMaker AI 環境に適応し、Docker コンテナとして事前設定されています。SageMaker AI には、SageMaker AI 機能を使用するための一連の組み込みアルゴリズムが用意されています。SageMaker AI に適応する ML アルゴリズムの詳細については、「アルゴリズムの選択」およびAmazon SageMaker 組み込みアルゴリズムを使用する」を参照してください。SageMaker AI 組み込みアルゴリズム API オペレーションについては、Amazon SageMaker Python SDK の「ファーストパーティアルゴリズム 」を参照してください。 -
成人国勢調査データセット
- Ronny Kohavi 氏と Barry Becker 氏による 1994 年国勢調査局データベース からのデータセットです (Data Mining and Visualization、Silicon Graphics)。SageMaker AI XGBoost モデルは、このデータセットを使用してトレーニングされ、個人が年間 50,000 USD 以上を行うかどうかを予測します。