Light モデルを調整するGBM - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Light モデルを調整するGBM

自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、データセットのトレーニングと検証でさまざまなハイパーパラメータをテストする多数のジョブを実行して、モデルの最適なバージョンを見つけます。モデル調整は、次のハイパーパラメータに重点を置いています。

注記

学習目的関数は、ラベル列の一意の整数の数によって決定される分類タスクの種類に基づいて自動的に割り当てられます。詳細については、「ライトGBMハイパーパラメータ」を参照してください。

  • モデルトレーニング中に最適化する学習の目標関数

  • 検証中にモデルのパフォーマンスを評価するための評価指標

  • モデルの自動調整時に使用する一連のハイパーパラメータと各値の範囲

自動モデル調整は、指定されたハイパーパラメータを検索して、選択された評価メトリクスを最適化するモデルになる値の組み合わせを見つけます。

注記

LightGBM の自動モデル調整は、 SageMaker コンソールからではなく SageMaker SDKs、Amazon からのみ使用できます。

モデル調整の詳細については、「を使用した自動モデル調整 SageMaker」を参照してください。

LightGBM アルゴリズムによって計算された評価メトリクス

SageMaker LightGBM アルゴリズムは、モデルの検証に使用する以下のメトリクスを計算します。評価メトリクスは、ラベル列の一意の整数の数によって決定される分類タスクの種類に基づいて自動的に割り当てられます。

メトリクス名 説明 最適化の方向 正規表現パターン
rmse 二乗平均平方根誤差 最小化 "rmse: ([0-9\\.]+)"
l1 平均絶対誤差 最小化 "l1: ([0-9\\.]+)"
l2 平均二乗誤差 最小化 "l2: ([0-9\\.]+)"
huber Huber 損失 最小化 "huber: ([0-9\\.]+)"
fair 公平性損失 最小化 "fair: ([0-9\\.]+)"
binary_logloss 二項交差エントロピー 最大化 "binary_logloss: ([0-9\\.]+)"
binary_error バイナリエラー 最小化 "binary_error: ([0-9\\.]+)"
auc AUC 最大化 "auc: ([0-9\\.]+)"
average_precision 平均適合率スコア 最大化 "average_precision: ([0-9\\.]+)"
multi_logloss マルチクラス交差エントロピー 最大化 "multi_logloss: ([0-9\\.]+)"
multi_error 多クラスエラースコア 最小化 "multi_error: ([0-9\\.]+)"
auc_mu AUC-mu 最大化 "auc_mu: ([0-9\\.]+)"
cross_entropy 交差エントロピー 最小化 "cross_entropy: ([0-9\\.]+)"

調整可能なライトGBMハイパーパラメータ

次のハイパーパラメータを使用して LightGBM モデルを調整します。LightGBM 評価メトリクスの最適化に最も大きな影響を与えるハイパーパラメータは、learning_rate、、num_leavesfeature_fractionbagging_fractionbagging_freqmax_depthおよび ですmin_data_in_leaf。すべての LightGBM ハイパーパラメータのリストについては、「」を参照してくださいライトGBMハイパーパラメータ

Parameter Name パラメータタイプ 推奨範囲
learning_rate ContinuousParameterRanges MinValue: 0.001、 MaxValue: 0.01
num_leaves IntegerParameterRanges MinValue: 10、 MaxValue: 100
feature_fraction ContinuousParameterRanges MinValue: 0.1、 MaxValue: 1.0
bagging_fraction ContinuousParameterRanges MinValue: 0.1、 MaxValue: 1.0
bagging_freq IntegerParameterRanges MinValue: 0、 MaxValue: 10
max_depth IntegerParameterRanges MinValue: 15、 MaxValue: 100
min_data_in_leaf IntegerParameterRanges MinValue: 10、 MaxValue: 200