CatBoost - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

CatBoost

CatBoost は、Gradient Boosting Decision Tree (GBDT) アルゴリズムの人気のある高性能オープンソース実装です。GBDT は、より単純で弱いモデルのセットからの見積りのアンサンブルを組み合わせることで、ターゲット変数を正確に予測しようとする教師あり学習アルゴリズムです。

CatBoost では、 に 2 つの重要なアルゴリズムの進歩が導入されていますGBDT。

  1. 従来のアルゴリズムに代わる順列駆動型の、順序付けされたブースティングの実装

  2. カテゴリ別特徴を処理するための革新的なアルゴリズム

どちらの手法も、現在存在する勾配ブーストアルゴリズムの実装すべてに存在する、特殊なターゲットリークによって引き起こされる予測シフトに対処するために作成されました。このページには、Amazon EC2インスタンスのレコメンデーションと のサンプルノートブックに関する情報が含まれています CatBoost。

アルゴリズムの Amazon EC2インスタンスの CatBoostレコメンデーション

SageMaker CatBoost 現在、 を使用してのみトレーニングされますCPUs。 CatBoost はメモリバウンド (コンピューティングバウンドではなく) アルゴリズムです。そのため、コンピューティング最適化インスタンス (C5 など) よりも汎用コンピューティングインスタンス (M5 など) を選択することをお勧めします。さらに、トレーニングデータを保持するために、選択したインスタンスに十分なメモリを用意することを推奨します。

CatBoost サンプルノートブック

次の表は、Amazon SageMaker CatBoost アルゴリズムのさまざまなユースケースに対処するさまざまなサンプルノートブックの概要を示しています。

ノートブックのタイトル 説明

Amazon SageMaker LightGBM と CatBoost アルゴリズムによる表形式分類

このノートブックでは、Amazon SageMaker CatBoostアルゴリズムを使用して表形式の分類モデルをトレーニングおよびホストする方法について説明します。

Amazon SageMaker LightGBM と CatBoost アルゴリズムによる表形式の回帰

このノートブックでは、Amazon SageMaker CatBoostアルゴリズムを使用して表形式の回帰モデルをトレーニングおよびホストする方法について説明します。

で例を実行するために使用できる Jupyter ノートブックインスタンスを作成してアクセスする方法については SageMaker、「」を参照してくださいAmazon SageMaker Notebook インスタンス。ノートブックインスタンスを作成して開いたら、SageMakerサンプルタブを選択してすべての SageMaker サンプルのリストを表示します。ノートブックを開くには、その [Use (使用)] タブを選択し、[Create copy (コピーを作成)] を選択します。