CatBoost - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CatBoost

CatBoost は、勾配ブースティング決定ツリー (GBDT) アルゴリズムの簡単かつ費用効果の高いオープンソース実装です。GBDT はより単純でより弱いモデルの集合から得られた推定のアンサンブルを組み合わせることで、ターゲット変数の正確な予測を試みる、教師あり学習アルゴリズムです。

CatBoost は GBDT に次の 2 つの重要なアルゴリズムの進歩をもたらします。

  1. 従来のアルゴリズムに代わる順列駆動型の、順序付けされたブースティングの実装

  2. カテゴリ別特徴を処理するための革新的なアルゴリズム

どちらの手法も、現在存在する勾配ブーストアルゴリズムの実装すべてに存在する、特殊なターゲットリークによって引き起こされる予測シフトに対処するために作成されました。このページには、CatBoost の Amazon EC2 インスタンスに関する推奨事項とサンプルノートブックについての情報が含まれています。

CatBoost アルゴリズムの Amazon EC2 インスタンス推奨

SageMaker AI CatBoost は現在、CPUs。CatBoost は (CPU バウンドではなく) メモリバウンドアルゴリズムです。そのため、コンピューティング最適化インスタンス (C5 など) よりも汎用コンピューティングインスタンス (M5 など) を選択することをお勧めします。さらに、トレーニングデータを保持するために、選択したインスタンスに十分なメモリを用意することを推奨します。

CatBoost サンプルノートブック

次の表は、Amazon SageMaker AI CatBoost アルゴリズムのさまざまなユースケースに対応するさまざまなサンプルノートブックの概要を示しています。

ノートブックのタイトル 説明

Amazon SageMaker AI LightGBM および CatBoost アルゴリズムによる表形式分類

このノートブックでは、Amazon SageMaker AI CatBoost アルゴリズムを使用して表形式の分類モデルをトレーニングおよびホストする方法を示します。

Amazon SageMaker AI LightGBM および CatBoost アルゴリズムを使用した表形式回帰

このノートブックでは、Amazon SageMaker AI CatBoost アルゴリズムを使用して表形式の回帰モデルをトレーニングおよびホストする方法を示します。

SageMaker AI でサンプルを実行するために使用できる Jupyter Notebook インスタンスを作成してアクセスする方法については、「」を参照してくださいAmazon SageMaker ノートブックインスタンス。ノートブックインスタンスを作成して開いたら、SageMaker AI Examples タブを選択して、すべての SageMaker AI サンプルのリストを表示します。ノートブックを開くには、その [Use (使用)] タブを選択し、[Create copy (コピーを作成)] を選択します。