調校線性學習程式模型 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

調校線性學習程式模型

「自動模型調校」,又稱為超參數調校,會透過在您的資料集上,執行許多測試超參數範圍的任務,來尋找最佳版本的模型。您可以選擇可調校的超參數、每一個超參數的值範圍,及目標指標。您可以從演算法運算的指標中選擇目標指標。自動模型調校會搜尋所選擇的超參數,以找出產生之模型可最佳化目標指標的值組合。

線性學習程式演算法也有內部機制可調校超參數,與此處描述的自動模型調校功能有所區隔。根據預設,線性學習程式演算法會透過平行訓練多個模型來調校超參數。當您使用自動模型調校時,線性學習程式的內部調校機制會自動關閉。這會將平行模型的數量 num_models 設為 1。演算法會忽略您針對 num_models 設定的任何值。

如需模型調校的詳細資訊,請參閱 執行自動模型調整 SageMaker

依線性學習程式演算法運算的指標

線性學習程式演算法回報下表中的指標,它們是在訓練期間計算的。選擇其中一個做為目標指標。為了避免過度擬合,建議您針對驗證指標調校模型,不是針對訓練指標。

指標名稱 描述 最佳化方向
test:absolute_loss

測試資料集之最終模型的絕對損失。此目標指標僅對迴歸有效。

最小化

test:binary_classification_accuracy

測試資料集之最終模型的準確性。此目標指標僅對二元分類有效。

最大化

test:binary_f_beta

測試資料集之最終模型的 F-beta 分數。根據預設是 F1 分數,這是精確度和回呼的調和平均數。此目標指標僅對二元分類有效。

最大化

test:dcg

測試資料集之最終模型的折扣累積增益。此目標指標僅對多類別分類有效。

最大化

test:macro_f_beta

測試資料集之最終模型的 F-beta 分數。此目標指標僅對多類別分類有效。

最大化

test:macro_precision

測試資料集之最終模型的精確度分數。此目標指標僅對多類別分類有效。

最大化

test:macro_recall

測試資料集之最終模型的回呼分數。此目標指標僅對多類別分類有效。

最大化

test:mse

測試資料集之最終模型的均方誤差。此目標指標僅對迴歸有效。

最小化

test:multiclass_accuracy

測試資料集之最終模型的準確性。此目標指標僅對多類別分類有效。

最大化

test:multiclass_top_k_accuracy

測試資料集之預測的前 k 個標籤之間的準確性。如果您選擇此指標做為目標,建議您使用 accuracy_top_k 超參數設定 k 的值。此目標指標僅對多類別分類有效。

最大化

test:objective_loss

模型訓練後之測試資料集的目標遺失函數平均值。根據預設,遺失是二元分類的邏輯遺失和迴歸的平方遺失。若要將遺失設定成其他類型,請使用 loss 超參數。

最小化

test:precision

測試資料集之最終模型的精確度。如果您選擇此指標做為目標,建議您將 binary_classifier_model_selection 超參數設成 precision_at_target_recall,並設定 target_recall 超參數的值,以設定目標回呼。此目標指標僅對二元分類有效。

最大化

test:recall

測試資料集之最終模型的回呼。如果您選擇此指標做為目標,建議您將 binary_classifier_model_selection 超參數設為 recall_at_target_precision,並設定 target_precision 超參數的值,以設定目標精確度。此目標指標僅對二元分類有效。

最大化

test:roc_auc_score

測試資料集之最終模型接收操作特徵曲線(ROC 曲線)以下的區域。此目標指標僅對二元分類有效。

最大化

validation:absolute_loss

驗證資料集之最終模型的絕對損失。此目標指標僅對迴歸有效。

最小化

validation:binary_classification_accuracy

驗證資料集之最終模型的準確性。此目標指標僅對二元分類有效。

最大化

validation:binary_f_beta

驗證資料集之最終模型的 F-beta 分數。根據預設,F-beta 分數是 F1 分數,這是 validation:precisionvalidation:recall 指標的調和平均數。此目標指標僅對二元分類有效。

最大化

validation:dcg

驗證資料集之最終模型的折扣累積增益。此目標指標僅對多類別分類有效。

最大化

validation:macro_f_beta

驗證資料集之最終模型的 F-beta 分數。此目標指標僅對多類別分類有效。

最大化

validation:macro_precision

驗證資料集之最終模型的精準度分數。此目標指標僅對多類別分類有效。

最大化

validation:macro_recall

驗證資料集之最終模型的回呼分數。此目標指標僅對多類別分類有效。

最大化

validation:mse

驗證資料集之最終模型的均方誤差。此目標指標僅對迴歸有效。

最小化

validation:multiclass_accuracy

驗證資料集之最終模型的準確性。此目標指標僅對多類別分類有效。

最大化

validation:multiclass_top_k_accuracy

驗證資料集之預測的前 k 個標籤之間的準確性。如果您選擇此指標做為目標,建議您使用 accuracy_top_k 超參數設定 k 的值。此目標指標僅對多類別分類有效。

最大化

validation:objective_loss

驗證資料集每個 epoch 上目標遺失函數的平均值。根據預設,遺失是二元分類的邏輯遺失和迴歸的平方遺失。若要將遺失設定成其他類型,請使用 loss 超參數。

最小化

validation:precision

驗證資料集之最終模型的精準度。如果您選擇此指標做為目標,建議您將 binary_classifier_model_selection 超參數設成 precision_at_target_recall,並設定 target_recall 超參數的值,以設定目標回呼。此目標指標僅對二元分類有效。

最大化

validation:recall

驗證資料集之最終模型的回呼。如果您選擇此指標做為目標,建議您將 binary_classifier_model_selection 超參數設為 recall_at_target_precision,並設定 target_precision 超參數的值,以設定目標精確度。此目標指標僅對二元分類有效。

最大化

validation:rmse

驗證資料集之最終模型的均方根誤差。此目標指標僅對迴歸有效。

最小化

validation:roc_auc_score

驗證資料集之最終模型接收操作特徵曲線(ROC 曲線)以下的區域。此目標指標僅對二元分類有效。

最大化

調校線性學習程式超參數

您可以使用以下超參數調校線性學習程式模型。

參數名稱 參數類型 建議範圍
wd

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

l1

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

learning_rate

ContinuousParameterRanges

MinValue: 1e-5, MaxValue: 1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue: 5000

use_bias

CategoricalParameterRanges

[True, False]

positive_example_weight_mult

ContinuousParameterRanges

MinValue:1e-5、MaxValue1e5