語意分段超參數 - Amazon SageMaker

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

語意分段超參數

下表列出 Amazon SageMaker 語意分割演算法支援的網路架構、資料輸入和訓練的超參數。您可以在 CreateTrainingJob 請求的 AlgorithmName 中,針對訓練指定語意分段。

網路架構超參數

參數名稱 描述
backbone

用於演算法編碼器元件的骨幹。

選用

有效值:resnet-50resnet-101

預設值:resnet-50

use_pretrained_model

預先訓練模型是否會用於骨幹。

選用

有效值:TrueFalse

預設值:True

algorithm

要用於語意分段的演算法。

選用

有效值:

預設值:fcn

資料超參數

參數名稱 描述
num_classes

要分段的類別數。

必要

有效值:2 ≤ 正整數 ≤ 254

num_training_samples

訓練資料中的樣本數。演算法會使用此值設定學習率排程器。

必要

有效值:正整數

base_size

定義影像在裁剪前的重新縮放方式。影像會重新縮放,將較長一邊的大小長度設為 base_size 乘以介於 0.5 到 2.0 的隨機數字,而較短一邊的大小長度則會運算到保留長寬比。

選用

有效值:大於 16 的正整數

預設值:520

crop_size

訓練期間輸入的影像大小。我們會根據 base_size 隨機重新縮放輸入影像,然後採用邊常等於 crop_size 的隨機正方形裁剪。系統會將 crop_size 自動四捨五入為 8 的倍數。

選用

有效值:大於 16 的正整數

預設值:240

訓練超參數

參數名稱 描述
early_stopping

是否要在訓練期間使用提前停止邏輯。

選用

有效值:TrueFalse

預設值:False

early_stopping_min_epochs

必須執行的最低 epoch 數。

選用

有效值:整數

預設值:5

early_stopping_patience

在演算法強制提前停止前,需符合較低效能容忍度的 epoch 數。

選用

有效值:整數

預設值:4

early_stopping_tolerance

如果訓練任務分數 (mIOU) 的相對改善小於此值,則提前停止會將 epoch 視為尚未改善。只有在 early_stopping = True 時才會使用此值。

選用

有效值:0 ≤ 浮點數 ≤ 1

預設值:0.0

epochs

用於訓練的 epoch 數。

選用

有效值:正整數

預設值:10

gamma1

rmsprop 平方梯度的移動平均衰減因子。僅限用於 rmsprop

選用

有效值:0 ≤ 浮點數 ≤ 1

預設值:0.9

gamma2

rmsprop 的動力因子。

選用

有效值:0 ≤ 浮點數 ≤ 1

預設值:0.9

learning_rate

初始學習率。

選用

有效值:0 < 浮點數 ≤ 1

預設值:0.001

lr_scheduler

控制其隨時間減少值的學習率排程形狀。

選用

有效值:

  • step:逐步衰減,系統會依 lr_scheduler_step 指定多個 epoch 後的 lr_scheduler_factor 降低(乘以)學習率。

  • poly:使用多項式函數的平滑衰減。

  • cosine:使用餘弦函數的平滑衰減。

預設值:poly

lr_scheduler_factor

假設 lr_scheduler 的設定為 step,則系統會依 lr_scheduler_step 指定每個 epoch 後降低(乘以)learning_rate 的比例。否則,會遭到忽略。

選用

有效值:0 ≤ 浮點數 ≤ 1

預設值:0.1

lr_scheduler_step

lr_scheduler_factor 降低(乘以)learning_rate 後的以逗號分隔的 epoch 清單。例如,假設該值的設定為「"10, 20"」,則系統會依第 10 個 epoch 後的 lr_scheduler_factor 降低 learning-rate,並再次依第 20 個 epoch 後的此因子降低學習率。

如果 lr_scheduler 的設定為 step,則為有條件必要。否則,會遭到忽略。

有效值:字串

預設值:(無預設值,使用時則此值為必要。)

mini_batch_size

訓練的批次大小。使用較大的 mini_batch_size 通常會加快訓練,但是可能會使您記憶體不足。記憶體用量會受 mini_batch_sizeimage_shape 參數,以及骨幹架構影響。

選用

有效值:正整數

預設值:16

momentum

sgd 最佳化工具的動力。當您使用其他最佳化工具時,語意分段演算法會忽略此參數。

選用

有效值:0 < 浮點數 ≤ 1

預設值:0.9

optimizer

最佳化工具類型。如需最佳化工具的詳細資訊,請選擇適當連結:

選用

有效值:adamadagradnagrmspropsgd

預設值:sgd

syncbn

如果設定為 True,則會針對跨 GPU 處理的所有範例計算批次標準化平均值和差異。

選用

有效值:TrueFalse

預設值:False

validation_mini_batch_size

驗證的批次大小。使用較大的 mini_batch_size 通常會加快訓練,但是可能會使您記憶體不足。記憶體用量會受 mini_batch_sizeimage_shape 參數,以及骨幹架構影響。

  • 若要為整個影像上的驗證進行評分,而不想要裁切影像,請將此參數設為 1。若您希望測量整個影像的整體效能,請使用此選項。

    注意

    validation_mini_batch_size 參數設為 1,會使演算法為每個影像建立一個新的網路模型。這可能會使驗證和訓練變慢。

  • 若要將影像裁切至 crop_size 參數中指定的大小,即使是在評估中,也請將此參數設為大於 1 的值。

選用

有效值:正整數

預設值:16

weight_decay

sgd 最佳化工具的加權衰減係數。當您使用其他最佳化工具時,演算法會忽略此參數。

選用

有效值:0 < 浮點數 < 1

預設值:0.0001