翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ライトGBMハイパーパラメータ
次の表に、Amazon SageMaker LightGBM アルゴリズムに必要または最も一般的に使用されるハイパーパラメータのサブセットを示します。ユーザーは、データからモデルパラメータを推定しやすくするために、これらのパラメータを設定します。 SageMaker LightGBM アルゴリズムは、オープンソースの LightGBM
注記
デフォルトのハイパーパラメータは、ライトGBMサンプルノートブック のサンプルデータセットに基づいています。
デフォルトでは、 SageMaker LightGBM アルゴリズムは分類問題のタイプに基づいて評価メトリクスと目標関数を自動的に選択します。LightGBM アルゴリズムは、データ内のラベルの数に基づいて分類問題のタイプを検出します。リグレッションの問題の場合、評価指標は二乗平均平方根誤差で、目的関数は L2 損失です。二項分類の問題の場合は、評価指標と目的関数はどちらも二項交差エントロピーです。多クラス分類の問題の場合、評価指標は多クラス交差エントロピーで、目的関数はソフトマックスです。metric
ハイパーパラメータを使用して、デフォルトの評価メトリクスを変更できます。説明、有効な値、デフォルト値など、LightGBM ハイパーパラメータの詳細については、次の表を参照してください。
Parameter Name | 説明 |
---|---|
num_boost_round |
ブースティングの反復の最大数。注: LightGBM 有効な値: 整数、範囲:正の整数。 デフォルト値: |
early_stopping_rounds |
ある検証データポイントの 1 つのメトリクスが最後の 有効な値: 整数。 デフォルト値: |
metric |
検証データの評価メトリクス。
有効な値: 文字列、次のいずれか: ( デフォルト値: |
learning_rate |
トレーニング例の各バッチを完了した後に、モデルの重みが更新されるレート。 有効な値: 浮動小数点、範囲: ( デフォルト値: |
num_leaves |
あるツリーの葉の最大数。 有効な値: 整数、範囲: ( デフォルト値: |
feature_fraction |
各反復 (ツリー) で選択される特徴量のサブセット。1.0 未満にする必要があります。 有効な値: 浮動小数点、範囲: ( デフォルト値: |
bagging_fraction |
有効な値: 浮動小数点、範囲: ( デフォルト値: |
bagging_freq |
バギングを実行する頻度。LightGBM は 有効な値: 整数、範囲: 負以外の整数。 デフォルト値: |
max_depth |
ツリーモデルの最大深度。これはデータの量が少ない場合のオーバーフィットを処理するのに使われます。 有効な値: 整数。 デフォルト値: |
min_data_in_leaf |
1 つの葉に含まれるデータの最小量。オーバーフィットの処理にも使われます。 有効な値: 整数、範囲: 負以外の整数。 デフォルト値: |
max_delta_step |
ツリーの葉の最大出力を制限するのに使用されます。 有効な値: 浮動小数点数。 デフォルト値: |
lambda_l1 |
L1 正規化。 有効な値: 浮動小数点数、範囲: 負以外の浮動小数点数。 デフォルト値: |
lambda_l2 |
L2 正規化。 有効な値: 浮動小数点数、範囲: 負以外の浮動小数点数。 デフォルト値: |
boosting |
ブースティングの種類 有効な値: 文字列、次のいずれか: ( デフォルト値: |
min_gain_to_split |
分割を実行するための最小ゲイン。トレーニングの高速化に使われます。 有効な値: 整数、浮動小数点数: 負以外の浮動小数点数。 デフォルト値: |
scale_pos_weight |
正のクラスを持つラベルの重み。二項分類タスクにのみ使用されます。 有効な値: 浮動小数点数、範囲: 正の浮動小数点数 デフォルト値: |
tree_learner |
ツリーの線形の種類。 有効な値: 文字列、次のいずれか: ( デフォルト値: |
feature_fraction_bynode |
各ツリーノードのランダムな特徴量のサブセットを選択します。例えば、 有効な値: 整数、範囲: ( デフォルト値: |
is_unbalance |
トレーニングデータが不均衡な場合は、 有効な値: 文字列、次のいずれか: ( デフォルト値: |
max_bin |
特徴量の値をバケット化するために使用するビンの最大数。ビンの数が少ないとトレーニングの精度は低下することがありますが、一般的なパフォーマンスは向上する可能性があります。オーバーフィットの処理にも使われます。 有効な値: 整数、範囲: (1, ∞)。 デフォルト値: |
tweedie_variance_power |
Tweedie 分布の分散を制御します。これを 有効な値: 浮動小数点数、範囲: [ デフォルト値: |
num_threads |
Light の実行に使用される並列スレッドの数GBM。値 0 は、OpenMP のデフォルトスレッド数を意味します。 有効な値: 整数、範囲: 負以外の整数。 デフォルト値: |
verbosity |
出力メッセージの詳細。 有効な値: 整数。 デフォルト値: |