本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
調整RCF模型
自動模型調校,又稱為超參數調校或超參數最佳化,會透過在您的資料集上執行許多測試超參數範圍的任務,來尋找最佳版本的模型。您可以選擇可調校的超參數、每一個超參數的值範圍,及目標指標。您可以從演算法運算的指標中選擇目標指標。自動模型調校會搜尋所選擇的超參數,以找出產生之模型可最佳化目標指標的值組合。
Amazon SageMaker RCF 演算法是一種無監督的異常偵測演算法,需要標籤測試資料集才能進行超參數最佳化。RCF 計算測試資料點的異常分數,如果資料點的分數超過平均分數的三個標準差,則將資料點標記為異常。這又稱為三標準差限制試誤法 (three-sigma limit heuristic)。F1 分數是依據計算標籤和實際標籤之間的差異。超參數調校任務會尋找將該分數最大化的模型。超參數最佳化是否成功,取決於三標準差限制試誤法對測試資料集的適用性。
如需模型調校的詳細資訊,請參閱使用 自動模型調校 SageMaker。
RCF 演算法運算的指標
RCF 演算法會在訓練期間計算下列指標。調校模型時,請選擇此指標做為目標指標。
指標名稱 | 描述 | 最佳化方向 |
---|---|---|
test:f1 |
測試資料集上的 F1 分數,根據計算標籤和實際標籤之間的差異。 |
最大化 |
可調RCF超參數
您可以使用下列超參數來調整RCF模型。
參數名稱 | 參數類型 | 建議範圍 |
---|---|---|
num_samples_per_tree |
IntegerParameterRanges |
MinValue:1, MaxValue:2048 |
num_trees |
IntegerParameterRanges |
MinValue:50、 MaxValue:1000 |