ライトGBM - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ライトGBM

LightGBM は、Gradient Boosting Decision Tree (GBDT) アルゴリズムの一般的で効率的なオープンソース実装です。GBDT は、より単純で弱いモデルのセットからの見積りのアンサンブルを組み合わせることで、ターゲット変数を正確に予測しようとする教師あり学習アルゴリズムです。LightGBM は、追加の手法を使用して、従来の の効率とスケーラビリティを大幅に向上させますGBDT。このページには、Amazon EC2インスタンスのレコメンデーションと Light のサンプルノートブックに関する情報が含まれていますGBM。

LightGBM アルゴリズムの Amazon EC2インスタンスのレコメンデーション

SageMaker LightGBM は現在、単一インスタンスとマルチインスタンスのCPUトレーニングをサポートしています。マルチインスタンスCPUトレーニング (分散トレーニング) では、推定器を定義するときに 1 instance_countより大きい値を指定します。Light を使用した分散トレーニングの詳細についてはGBM、「Dask を使用した Amazon SageMaker LightGBM Distributed トレーニング」を参照してください。

LightGBM はメモリバウンド (コンピューティングバウンドではなく) アルゴリズムです。そのため、コンピューティング最適化インスタンス (C5 など) よりも汎用コンピューティングインスタンス (M5 など) を選択することをお勧めします。さらに、トレーニングデータを保持するために、選択したインスタンスに十分なメモリを用意することを推奨します。

ライトGBMサンプルノートブック

次の表は、Amazon SageMaker LightGBM アルゴリズムのさまざまなユースケースに対処するさまざまなサンプルノートブックの概要を示しています。

ノートブックのタイトル 説明

Amazon SageMaker LightGBM と CatBoost アルゴリズムによる表形式分類

このノートブックでは、Amazon SageMaker LightGBM アルゴリズムを使用して表形式の分類モデルをトレーニングおよびホストする方法について説明します。

Amazon SageMaker LightGBM と CatBoost アルゴリズムによる表形式の回帰

このノートブックでは、Amazon SageMaker LightGBM アルゴリズムを使用して表形式の回帰モデルをトレーニングおよびホストする方法について説明します。

Dask を使用した Amazon SageMaker LightGBM Distributed トレーニング

このノートブックでは、Dask フレームワークを使用した Amazon SageMaker LightGBM アルゴリズムによる分散トレーニングを示します。

で例を実行するために使用できる Jupyter ノートブックインスタンスを作成してアクセスする方法については SageMaker、「」を参照してくださいAmazon SageMaker Notebook インスタンス。ノートブックインスタンスを作成して開いたら、SageMakerサンプルタブを選択してすべての SageMaker サンプルのリストを表示します。ノートブックを開くには、その [Use (使用)] タブを選択し、[Create copy (コピーを作成)] を選択します。