语义分割超参数 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语义分割超参数

下表列出了 Amazon SageMaker 语义分割算法支持的网络架构、数据输入和训练的超参数。您可以在 CreateTrainingJob 请求的 AlgorithmName 中为训练指定语义分割。

网络架构超参数

参数名称 描述
backbone

要用于算法的编码器组件的主干。

可选

有效值:resnet-50resnet-101

默认值:resnet-50

use_pretrained_model

是否将预训练模型用于主干。

可选

有效值:TrueFalse

默认值:True

algorithm

要用于语义分割的算法。

可选

有效值:

默认值:fcn

数据超参数

参数名称 描述
num_classes

要分割的类的数量。

必填

有效值:2 ≤ 正整数 ≤ 254

num_training_samples

训练数据中的示例数。该算法使用此值来设置学习率计划程序。

必填

有效值:正整数

base_size

定义裁剪前如何重新缩放图像。图像被重新缩放,以便将长尺寸长度设置为 base_size 乘以 0.5 到 2.0 之间的随机数,并计算短尺寸以保持长宽比。

可选

有效值:正整数 > 16

默认值:520

crop_size

训练期间输入的图像大小。我们将根据 base_size 随机重新缩放输入图像,然后按照边长等于 crop_size 进行随机的方形裁剪。crop_size 将自动舍入到 8 的倍数。

可选

有效值:正整数 > 16

默认值:240

训练超参数

参数名称 描述
early_stopping

是否在训练期间使用提前停止逻辑。

可选

有效值:TrueFalse

默认值:False

early_stopping_min_epochs

必须运行的纪元的最小数量。

可选

有效值:整数

默认值:5

early_stopping_patience

在算法强制提前停止之前满足较低性能容差的纪元数。

可选

有效值:整数

默认值:4

early_stopping_tolerance

如果训练作业分数 mIOU 的相对改善小于此值,则提前停止将纪元视为未改善。仅当 early_stopping = True 时使用。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.0

epochs

用于训练的纪元的数量。

可选

有效值:正整数

默认值:10

gamma1

rmsprop 的平方梯度的移动平均值的衰减系数。仅用于 rmsprop

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.9

gamma2

rmsprop 的动量因子。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.9

learning_rate

初始学习率。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.001

lr_scheduler

学习率计划的形状,可控制其随时间的推移而减少。

可选

有效值:

  • step:逐步衰减,在经过 lr_scheduler_step 指定的训练纪元数之后,学习率降低(乘以)lr_scheduler_factor

  • poly:使用多项式函数的平滑衰减。

  • cosine:使用余弦函数的平滑衰减。

默认值:poly

lr_scheduler_factor

如果 lr_scheduler 设置为 step,则为比率;在经过 lr_scheduler_step 指定的训练纪元数之后,learning_rate 降低(乘以)该比率。否则将忽略。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.1

lr_scheduler_step

一个逗号分隔的纪元数列表,在经过该纪元数后,learning_rate 减少(乘以)lr_scheduler_factor。例如,如果将值设置为 "10, 20",则在第 10 个纪元之后,learning-rate 会降低 lr_scheduler_factor,在第 20 个纪元之后,再次降低该系数。

有条件需要:如果 lr_scheduler 设置为 step。否则将忽略。

有效值:字符串

默认值:(没有默认值,因为使用时需要该值。)

mini_batch_size

训练的批次大小。使用大型 mini_batch_size 通常会加快训练速度,但可能会导致内存不足。内存使用率受 mini_batch_sizeimage_shape 参数的值以及主干架构的影响。

可选

有效值:正整数

默认值:16

momentum

sgd 优化程序的动量。当您使用其他优化程序时,语义分割算法将忽略此参数。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.9

optimizer

优化程序的类型。有关优化程序的更多信息,请选择相应的链接:

可选

有效值:adamadagradnagrmspropsgd

默认值:sgd

syncbn

如果设置为 True,则为 GPU 中处理的所有样本计算批量标准化平均值和方差。

可选

有效值:TrueFalse

默认值:False

validation_mini_batch_size

验证的批次大小。大型 mini_batch_size 通常会加快训练速度,但可能会导致内存不足。内存使用率受 mini_batch_sizeimage_shape 参数的值以及主干架构的影响。

  • 要在不裁剪图像的情况下对整个图像的验证评分,请将此参数设置为 1。如果要整体测量整个图像的性能,请使用此选项。

    注意

    validation_mini_batch_size 参数设置为 1 会导致算法为每个图像创建一个新的网络模型。这可能会减慢验证和训练的速度。

  • 要将图像裁剪为 crop_size 参数中指定的大小,即使在评估期间,也要将此参数设置为大于 1 的值。

可选

有效值:正整数

默认值:16

weight_decay

sgd 优化程序的权重衰减系数。当您使用其他优化程序时,算法将忽略此参数。

可选

有效值:0 < 浮点型 < 1

默认值:0.0001