图像分类超参数
超参数是在机器学习模型开始学习之前设置的参数。Amazon SageMaker 内置图像分类算法支持以下超参数。有关图像分类超参数优化的信息,请参阅优化图像分类模型。
参数名称 | 描述 |
---|---|
num_classes |
输出分类的数量。此参数定义网络输出的维度,通常设置为数据集中的类别数。 除了多类别分类外,还支持多标签分类。有关如何使用增强清单文件处理多标签分类的详情,请参阅图像分类算法的输入/输出接口。 必填 有效值:正整数 |
num_training_samples |
输入数据集中的训练示例数。 如果此值与训练集中的示例数不匹配,则 必填 有效值:正整数 |
augmentation_type |
数据扩增类型。输入图像可按照下面指定的多种方式扩增。
可选 有效值: 默认值:无默认值 |
beta_1 |
可选 有效值:浮点值。范围为 [0, 1]。 默认值:0.9 |
beta_2 |
可选 有效值:浮点值。范围为 [0, 1]。 默认值:0.999 |
checkpoint_frequency |
存储模型参数的周期 (纪元数)。 请注意,所有检查点文件都会作为最终模型文件“model.tar.gz”的一部分保存,并上传到 S3 中的指定模型位置。这将根据训练期间保存的检查点数按比例增加模型文件的大小。 可选 有效值:不大于 默认值:无默认值(在验证准确率最高的纪元保存检查点。) |
early_stopping |
可选 有效值: 默认值: |
early_stopping_min_epochs |
可以调用提前停止逻辑之前必须运行的最小纪元数。仅当 可选 有效值:正整数 默认值:10 |
early_stopping_patience |
如果在相关指标中没有改进,则在结束训练前等待的纪元数。仅当 可选 有效值:正整数 默认值:5 |
early_stopping_tolerance |
用于评估准确率验证指标改善的相对容差。如果准确率改善除以上一个最佳准确率的比率小于设置的 可选 有效值:0 ≤ 浮点值 ≤ 1 默认值:0.0 |
epochs |
训练纪元数。 可选 有效值:正整数 默认值:30 |
eps |
可选 有效值:浮点值。范围为 [0, 1]。 默认值:1e-8 |
gamma |
可选 有效值:浮点值。范围为 [0, 1]。 默认值:0.9 |
image_shape |
输入图像尺寸,该尺寸与网络输入层的大小相同。其格式定义为“ 对于训练,如果任何输入图像的任何尺寸小于此参数,则训练将失败。如果图像较大,则会裁剪图像的一部分,并由此参数指定裁剪区域。如果设置了超参数 在推理时,输入图像的大小调整为 可选 有效值:字符串 默认值:“3,224,224” |
kv_store |
分布式训练期间的权重更新同步模式。可对各机器同步或异步更新权重更新。同步更新通常比异步更新提供更好的准确率,但速度较慢。请参阅 MXNet 中的分布式训练,以了解更多详细信息。 此参数不适用于单个机器训练。
可选 有效值: 默认值:无默认值 |
learning_rate |
初始学习率。 可选 有效值:浮点值。范围为 [0, 1]。 默认值:0.1 |
lr_scheduler_factor |
与 可选 有效值:浮点值。范围为 [0, 1]。 默认值:0.1 |
lr_scheduler_step |
降低学习率的纪元。正如 可选 有效值:字符串 默认值:无默认值 |
mini_batch_size |
训练的批次大小。在单机器多 GPU 设置中,每个 GPU 处理 可选 有效值:正整数 默认值:32 |
momentum |
用于 可选 有效值:浮点值。范围为 [0, 1]。 默认值:0.9 |
multi_label |
用于多标签分类的标志,其中每个示例可以分配多个标签。记录所有分类的平均准确率。 可选 有效值:0 或 1 默认值:0 |
num_layers |
网络的层数。对于包含大尺寸图像的数据 (例如 224x224 - 像 ImageNet),建议从数据集 [18, 34, 50, 101, 152, 200] 中选择层数。对于包含小尺寸图像的数据 (例如 28x28 - 像 CIFAR),建议从数据集 [20, 32, 44, 56, 110] 中选择层数。每个数据集中的层数均基于 ResNet 论文。对于迁移学习,层数定义了基础网络的架构,因此只能从数据集 [18, 34, 50, 101, 152, 200] 中选择。 可选 有效值:[18, 34, 50, 101, 152, 200] 或 [20, 32, 44, 56, 110] 中的正整数 默认值:152 |
optimizer |
优化程序类型。有关优化程序参数的更多详细信息,请参阅 MXNet 的 API。 可选 有效值:
默认值: |
precision_dtype |
用于训练的权重精度。该算法可以对权重使用单精度 ( 可选 有效值: 默认值: |
resize |
调整图像大小以进行训练后,图像最短边的像素数。如果未设置此参数,则使用训练数据时不调整大小。参数应该大于 使用图像内容类型时为必需 使用 RecordIO 内容类型时为可选 有效值:正整数 默认值:无默认值 |
top_k |
训练期间报告前 k 个最大数准确率。此参数必须大于 1,因为 top-1 训练准确率与已报告的常规训练准确率相同。 可选 有效值:大于 1 的正整数。 默认值:无默认值 |
use_pretrained_model |
指示使用预先训练的模型进行训练的标志。如果设置为 1,则加载具有相应层数的预先训练的模型并将其用于训练。只有顶部 FC 层使用随机权重进行重新初始化。否则,从头训练网络。 可选 有效值:0 或 1 默认值:0 |
use_weighted_loss |
用于多标签分类的加权交叉熵损失的标志(仅在 可选 有效值:0 或 1 默认值:0 |
weight_decay |
用于 可选 有效值:浮点值。范围为 [0, 1]。 默认值:0.0001 |