調校 k-NN 模型 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

調校 k-NN 模型

Amazon SageMaker k 最近鄰接演算法是受監督的演算法。此演算法會使用測試資料集,發出有關分類任務準確性或迴歸任務均方錯誤的指標。這些準確性指標會比較其個別任務的模型預測和實證測試資料所提供的基本事實。若要尋找報告測試資料集之最高準確性或最低錯誤的最佳模型,請執行 k-NN 的超參數調校任務。

自動模型調校,又稱為超參數調校,會透過在您的資料集上,執行許多測試超參數範圍的任務,來尋找最佳版本的模型。您可以選擇可調校的超參數、每一個超參數的值範圍,及目標指標。您可以選擇適合演算法預測任務的目標指標。自動模型調校會搜尋所選擇的超參數,以找出產生之模型可最佳化目標指標的值組合。超參數僅能用於協助預估模型參數,不提供已訓練模型用於建立預測。

如需模型調校的詳細資訊,請參閱使用 自動模型調校 SageMaker

由 k-NN 演算法計算的指標

k 近鄰演算法會在訓練期間計算下表兩個指標之一,隨 predictor_type 超參數指定的任務類型而定。

  • 分類器會指定分類任務並計算 test:accuracy

  • 迴歸器會指定迴歸任務並計算 test:mse

選擇適合所執行任務類型的 predictor_type 值,以在調校模型時計算相關的目標指標。

指標名稱 描述 最佳化方向
test:accuracy

predictor_type 設為分類器時,k-NN 會根據 k 近鄰標籤的平均值,比較預估標籤和測試通道資料所提供的基本事實。回報的準確性範圍從 0.0 (0%) 到 1.0 (100%)。

最大化

test:mse

predictor_type 設為迴歸器時,k-NN 會根據 k 近鄰標籤的平均值,比較預估標籤和測試通道資料所提供的基本事實。均方錯誤是經由比較兩個標籤所計算得出。

最小化

可調校的 k-NN 超參數

使用下列超參數來調校 Amazon SageMaker k 最近鄰居模型。

參數名稱 參數類型 建議範圍
k

IntegerParameterRanges

MinValue:1, MaxValue:1024

sample_size

IntegerParameterRanges

MinValue:256, MaxValue:20000000