調整RCF模型 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

調整RCF模型

自動模型調校,又稱為超參數調校或超參數最佳化,會透過在您的資料集上執行許多測試超參數範圍的任務,來尋找最佳版本的模型。您可以選擇可調校的超參數、每一個超參數的值範圍,及目標指標。您可以從演算法運算的指標中選擇目標指標。自動模型調校會搜尋所選擇的超參數,以找出產生之模型可最佳化目標指標的值組合。

Amazon SageMaker RCF 演算法是一種無監督的異常偵測演算法,需要標籤測試資料集才能進行超參數最佳化。RCF 計算測試資料點的異常分數,如果資料點的分數超過平均分數的三個標準差,則將資料點標記為異常。這又稱為三標準差限制試誤法 (three-sigma limit heuristic)。F1 分數是依據計算標籤和實際標籤之間的差異。超參數調校任務會尋找將該分數最大化的模型。超參數最佳化是否成功,取決於三標準差限制試誤法對測試資料集的適用性。

如需模型調校的詳細資訊,請參閱使用 自動模型調校 SageMaker

RCF 演算法運算的指標

RCF 演算法會在訓練期間計算下列指標。調校模型時,請選擇此指標做為目標指標。

指標名稱 描述 最佳化方向
test:f1

測試資料集上的 F1 分數,根據計算標籤和實際標籤之間的差異。

最大化

可調RCF超參數

您可以使用下列超參數來調整RCF模型。

參數名稱 參數類型 建議範圍
num_samples_per_tree

IntegerParameterRanges

MinValue:1, MaxValue:2048

num_trees

IntegerParameterRanges

MinValue:50、 MaxValue:1000