本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
物件偵測超參數
在 CreateTrainingJob
請求中,請指定您想要使用的訓練演算法。您也可以指定演算法特定的超參數,用來協助預估訓練資料集的模型參數。下表列出 Amazon 提供的超參數, SageMaker 用於訓練物件偵測演算法。如需物件訓練運作方式的詳細資訊,請參閱物件偵測的運作方式。
參數名稱 | 描述 |
---|---|
num_classes |
輸出類別的數量。此參數會定義網路輸出的維度,且通常會以資料集中的類別數量來設定該維度。 必要 有效值:正整數 |
num_training_samples |
輸入資料集中的訓練範例數量。 注意如果此值與訓練集中的範例數量不相符,則表示 必要 有效值:正整數 |
base_network |
可使用的基礎網路架構。 選用 有效值:'vgg-16' 或 'resnet-50' 預設值:'vgg-16' |
early_stopping |
選用 有效值: 預設值: |
early_stopping_min_epochs |
調用提前停止邏輯前,應執行的 epoch 數量下限。只有在 選用 有效值:正整數 預設值:10 |
early_stopping_patience |
若未在相關指標中進行改善,結束訓練前等待的 epoch 數量,如 選用 有效值:正整數 預設值:5 |
early_stopping_tolerance |
若要避免提早停止, 選用 有效值:0 ≤ 浮點數 ≤ 1 預設值:0.0 |
image_shape |
輸入影像的影像大小。我們會使用此大小將輸入影像重新調整為方形影像。我們建議您使用 300 和 512,以獲得更好的效能。 選用 有效值:正整數 ≥300 預設:300 |
epochs |
訓練 epoch 的數量。 選用 有效值:正整數 預設:30 |
freeze_layer_pattern |
可在基礎網路中凍結層的正規表示式 (regex)。例如,假設我們設定 選用 有效值:字串 預設:不凍結任何層。 |
kv_store |
用於分散式訓練的權重更新同步模式。各機器能採用同步或非同步的方式來更新權重。同步更新的準確度通常會高於非同步更新,但執行速度較慢。如需詳細資訊,請參閱分散式訓練 注意此參數不適用於單部機器訓練。 選用 有效值:
預設:- |
label_width |
用來進行跨訓練和驗證資料同步的強制填補標籤寬度。例如,如果資料中的一個影像包含最多 10 個物件,且每個物件註釋指定了 5 個數字 [class_id, left, top, width, height],則 選用 有效值:足以容納資料中最大註釋資訊長度的正整數。 預設:350 |
learning_rate |
初始學習率。 選用 有效值:浮點數 (0, 1] 預設:0.001 |
lr_scheduler_factor |
降低學習率的比率。搭配使用定義為 選用 有效值:浮點數 (0, 1) 預設:0.1 |
lr_scheduler_step |
要降低學習率的 epoch。 選用 有效值:字串 預設:空白字串 |
mini_batch_size |
訓練的批次大小。在單一機器多 CPU 設定中,每個 都會GPU處理 選用 有效值:正整數 預設:32 |
momentum |
選用 有效值:浮點數 (0, 1] 預設:0.9 |
nms_threshold |
非最大的抑制閾值。 選用 有效值:浮點數 (0, 1] 預設:0.45 |
optimizer |
最佳化工具類型。如需最佳化工具值的詳細資訊,請參閱 MXNet的 API 選用 有效值:['sgd', 'adam', 'rmsprop', 'adadelta'] 預設:'sgd' |
overlap_threshold |
評估重疊閾值。 選用 有效值:浮點數 (0, 1] 預設:0.5 |
use_pretrained_model |
指出是否要使用預先訓練模型進行訓練。若將此值設定為 1,則系統會載入具備對應架構的預先訓練模型,以進行訓練。否則,網路皆是從頭開始訓練。 選用 有效值:0 或 1 預設:1 |
weight_decay |
選用 有效值:浮點數 (0, 1) 預設:0.0005 |