本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Object2Vec 超参数
在 CreateTrainingJob
请求中,您可以指定训练算法。您也可以将特定于算法的超参数指定为地图。 string-to-string下表列出了 Object2Vec 训练算法的超参数。
参数名称 | 描述 |
---|---|
enc0_max_seq_len |
enc0 编码器的最大序列长度。 必填 有效值:1 ≤ 整数 ≤ 5000 |
enc0_vocab_size |
enc0 标记的词汇表大小。 必填 有效值:2 ≤ 整数 ≤ 3000000 |
bucket_width |
启用分桶时数据序列长度之间允许的差异。要启用分桶,请为该参数指定非零值。 可选 有效值:0 ≤ 整数 ≤ 100 默认值:0(不分桶) |
comparator_list |
用于自定义比较两个嵌入的方式的列表。Object2Vec 比较器运算符层将来自两个编码器的编码作为输入,并输出单个向量。该向量是将子向量串联在一起的结果。传递到 可选 有效值:包含三个二元运算符名称的任意组合的字符串:
默认值: |
dropout |
网络层的丢弃概率。丢弃法 是神经网络中使用的一种正规化形式,通过修剪相关的神经元来减少过拟合。 可选 有效值:0.0 ≤ 浮点值 ≤ 1.0 默认值:0.0 |
early_stopping_patience |
在应用提前停止之前,允许的无改进的连续纪元数。改进是使用 可选 有效值:1 ≤ 整数 ≤ 5 默认值:3 |
early_stopping_tolerance |
算法必须在连续纪元之间实现损失函数减少,以避免在 可选 有效值:0.000001 ≤ 浮点值 ≤ 0.1 默认值:0.01 |
enc_dim |
嵌入层的输出的维。 可选 有效值:4 ≤ 整数 ≤ 10000 默认值:4096 |
enc0_network |
enc0 编码器的网络模型。 可选 有效值:
默认值: |
enc0_cnn_filter_width |
卷积神经网络 (CNN) enc0 编码器的滤波器宽度。 条件 有效值:1 ≤ 整数 ≤ 9 默认值:3 |
enc0_freeze_pretrained_embedding |
是否冻结 enc0 预训练嵌入权重。 条件 有效值: 默认值: |
enc0_layers |
enc0 编码器中的层数。 条件 有效值:
默认值: |
enc0_pretrained_embedding_file |
辅助数据通道中的预训练 enc0 标记嵌入文件的文件名。 条件 有效值:包含字母数字字符、下划线或句点的字符串。[A-Za-z0-9\.\_] 默认值:""(空字符串) |
enc0_token_embedding_dim |
enc0 令牌嵌入层的输出维度。 条件 有效值:2 ≤ 整数 ≤ 1000 默认值:300 |
enc0_vocab_file |
用于将预训练的 enc0 标记嵌入向量映射到数值词汇的词汇文件。IDs 条件 有效值:包含字母数字字符、下划线或句点的字符串。[A-Za-z0-9\.\_] 默认值:""(空字符串) |
enc1_network |
enc1 编码器的网络模型。如果您希望 enc1 编码器使用与 enc0 相同的网络模型(包括超参数值),请将该值设置为 注意即使 enc0 和 enc1 编码器网络具有对称的架构,您也无法在这些网络中共享参数值。 可选 有效值:
默认值: |
enc1_cnn_filter_width |
CNNenc1 编码器的滤波器宽度。 条件 有效值:1 ≤ 整数 ≤ 9 默认值:3 |
enc1_freeze_pretrained_embedding |
是否冻结 enc1 预训练嵌入权重。 条件 有效值: 默认值: |
enc1_layers |
enc1 编码器中的层数。 条件 有效值:
默认值: |
enc1_max_seq_len |
enc1 编码器的最大序列长度。 条件 有效值:1 ≤ 整数 ≤ 5000 |
enc1_pretrained_embedding_file |
辅助数据通道中的 enc1 预训练标记嵌入文件的名称。 条件 有效值:包含字母数字字符、下划线或句点的字符串。[A-Za-z0-9\.\_] 默认值:""(空字符串) |
enc1_token_embedding_dim |
enc1 标记嵌入层的输出维度。 条件 有效值:2 ≤ 整数 ≤ 1000 默认值:300 |
enc1_vocab_file |
用于将预训练的 enc1 标记嵌入映射到词汇表的词汇文件。IDs 条件 有效值:包含字母数字字符、下划线或句点的字符串。[A-Za-z0-9\.\_] 默认值:""(空字符串) |
enc1_vocab_size |
enc0 标记的词汇表大小。 条件 有效值:2 ≤ 整数 ≤ 3000000 |
epochs |
要运行用于训练的纪元数。 可选 有效值:1 ≤ 整数 ≤ 100 默认值:30 |
learning_rate |
训练的学习率。 可选 有效值:1.0E-6 ≤ 浮点值 ≤ 1.0 默认值:0.0004 |
mini_batch_size |
在训练期间将 可选 有效值:1 ≤ 整数 ≤ 10000 默认值:32 |
mlp_activation |
多层感知器 (MLP) 层的激活函数类型。 可选 有效值:
默认值: |
mlp_dim |
图层输出的MLP维度。 可选 有效值:2 ≤ 整数 ≤ 10000 默认值:512 |
mlp_layers |
网络中的MLP层数。 可选 有效值:0 ≤ 整数 ≤ 10 默认值:2 |
negative_sampling_rate |
为帮助训练算法而生成的负样本与用户提供的正样本的比率。负样本表示实际不太可能出现的数据,并在训练时标记为不正确的样本。它们有助于训练模型,以区分观察到的正样本和未观察到的负样本。要指定用于训练的负样本与正样本的比率,请将该值设置为正整数。例如,如果在所有样本都是正样本的输入数据上训练算法,并将 可选 有效值:0 ≤ 整数 默认值:0 (关闭) |
num_classes |
用于分类训练的分类数。对于回归问题,Amazon SageMaker 会忽略这个超参数。 可选 有效值:2 ≤ 整数 ≤ 30 默认值:2 |
optimizer |
优化程序类型。 可选 有效值:
默认值: |
output_layer |
输出层的类型,您可以在其中指定任务是回归还是分类。 可选 有效值:
默认值: |
tied_token_embedding_weight |
是否将共享嵌入层用于两个编码器。如果两个编码器的输入使用相同的标记级单元,请使用共享标记嵌入层。例如,对于文档集合,如果一个编码器对句子进行编码,另一个编码器对整个文档进行编码,则可以使用共享标记嵌入层。这是因为,句子和文档都是由同一词汇表中的单词标记组成的。 可选 有效值: 默认值: |
token_embedding_storage_type |
在训练期间使用的梯度更新模式:在使用
可选 有效值: 默认值: |
weight_decay |
用于优化的权重衰减参数。 可选 有效值:0 ≤ 浮点值 ≤ 10000 默认值:0(无衰减) |