調整 LightGBM 模型 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

調整 LightGBM 模型

自動模型調校,又稱為超參數調校,會透過在您的訓練和驗證資料集上,執行許多測試超參數範圍的任務,來尋找最佳版本的模型。模型調整著重於以下超參數:

注意

學習目標函式會基於分類任務的類型自動指派,該類型由標籤欄中的唯一整數數量決定。如需詳細資訊,請參閱LightGBM 超參數

  • 要在模型訓練期間最佳化的學習目標函式

  • 用於在驗證期間評估模型效能的評估指標

  • 自動調整模型時要使用的一組超參數和一系列值

自動模型調整會搜尋您指定的超參數,以找到產生可最佳化所選評估指標之模型的值組合。

注意

LightGBM 的自動模型調校只能從 Amazon 取得 SageMaker SDKs,不能從 SageMaker 主控台取得。

如需模型調校的詳細資訊,請參閱使用 自動模型調校 SageMaker

LightGBM 演算法計算的評估指標

SageMaker LightGBM 演算法會運算下列指標,以用於模型驗證。評估指標會根據分類任務的類型自動指派,該類型由標籤欄中的唯一整數數目決定。

指標名稱 描述 最佳化方向 正則表達式
rmse 均方根誤差 最小化 "rmse: ([0-9\\.]+)"
l1 平均值絕對誤差。 最小化 "l1: ([0-9\\.]+)"
l2 均方誤差 最小化 "l2: ([0-9\\.]+)"
huber Huber 損失 最小化 "huber: ([0-9\\.]+)"
fair Fair 損失 最小化 "fair: ([0-9\\.]+)"
binary_logloss 二進位交叉熵 最大化 "binary_logloss: ([0-9\\.]+)"
binary_error 二進位錯誤 最小化 "binary_error: ([0-9\\.]+)"
auc AUC 最大化 "auc: ([0-9\\.]+)"
average_precision 平均精確度分數 最大化 "average_precision: ([0-9\\.]+)"
multi_logloss 多類交叉熵 最大化 "multi_logloss: ([0-9\\.]+)"
multi_error 多類別錯誤分數 最小化 "multi_error: ([0-9\\.]+)"
auc_mu AUC-mu 最大化 "auc_mu: ([0-9\\.]+)"
cross_entropy 交叉熵 最小化 "cross_entropy: ([0-9\\.]+)"

可調光GBM超參數

使用下列超參數調整 LightGBM 模型。對最佳化光線GBM評估指標影響最大的超參數為:learning_ratenum_leavesfeature_fractionbagging_fractionbagging_freqmax_depthmin_data_in_leaf。如需所有 LightGBM 超參數的清單,請參閱 LightGBM 超參數

參數名稱 參數類型 建議範圍
learning_rate ContinuousParameterRanges MinValue:0.001, MaxValue:0.01
num_leaves IntegerParameterRanges MinValue:10、 MaxValue:100
feature_fraction ContinuousParameterRanges MinValue:0.1、 MaxValue:1.0
bagging_fraction ContinuousParameterRanges MinValue:0.1、 MaxValue:1.0
bagging_freq IntegerParameterRanges MinValue:0、 MaxValue:10
max_depth IntegerParameterRanges MinValue:15, MaxValue:100
min_data_in_leaf IntegerParameterRanges MinValue:10, MaxValue:200