本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
DeepAR 超参数
下表列出了在使用 Amazon A SageMaker I Deepar 预测算法进行训练时可以设置的超参数。
参数名称 | 描述 |
---|---|
context_length |
在进行预测之前,模型需要获取查看的时间点数量。此参数的值应该与 必填 有效值:正整数 |
epochs |
扫描训练数据的最大次数。最佳值取决于您的数据大小和学习率。另请参阅 必填 有效值:正整数 |
prediction_length |
训练模型来预测的时间步长数,也称为预测期。训练后的模型始终生成此长度的预测。它无法生成更长的预测。在训练模型时, 必填 有效值:正整数 |
time_freq |
数据集中时间序列的粒度。使用
必填 有效值:一个整数,后跟 M、W、D、H 或 min。例如, |
cardinality |
在使用分类特征 ( 将基数设置为 要执行额外的数据验证,可以将此参数明确设置为实际值。例如,如果提供了两个分类特征,第一个有 2 个可能值,另一个有 3 个可能值,则将此项设置为 [2, 3]。 有关如何使用分类特征的更多信息,请参阅 DeepAR 主文档页面上的数据部分。 可选 有效值: 默认值: |
dropout_rate |
训练期间使用的丢弃比率。该模型使用 zoneout 正则化。对于每次迭代,不更新隐藏神经元的随机子集。典型值小于 0.2。 可选 有效值:浮点值 默认值:0.1 |
early_stopping_patience |
如果设置此参数,则在指定的 可选 有效值:整数 |
embedding_dimension |
每个分类特征学习的嵌入向量的大小(对所有分类特征使用相同的值)。 在提供了分类分组特征时,DeepAR 模型可以学习组级别的时间序列模式。为此,模型学习每个组大小为 可选 有效值:正整数 默认值:10 |
learning_rate |
训练中使用的学习率。典型值范围从 1e-4 到 1e-1。 可选 有效值:浮点值 默认值:1e-3 |
likelihood |
模型生成一个概率预测,并可以提供分布的分位数和返回样本。根据您的数据,选择用于不确定性估算的相应可能性(噪声模型)。可以选择以下可能性:
可选 有效值:gaussian (高斯)、beta、negative-binomial (负二项式)、student-T (T 检验) 或 deterministic-L1 (确定性 L1) 之一。 默认值: |
mini_batch_size |
训练期间使用的小批次的大小。典型值范围为 32 到 512。 可选 有效值:正整数 默认值:128 |
num_cells |
RNN 的各个隐藏层中使用的单元数。典型值范围为 30 到 100。 可选 有效值:正整数 默认值:40 |
num_dynamic_feat |
要强制 DeepAR 不使用动态特征(即使数据中存在动态特征),请将 要执行额外的数据验证,可以将此参数明确设置为实际整数值。例如,如果提供了两个动态特征,则将此项设置为 2。 可选 有效值: 默认值: |
num_eval_samples |
在计算测试准确性指标时,每个时间序列使用的样本数量。此参数对训练或最终模型没有任何影响。具体而言,可以使用不同数量的样本来查询模型。此参数仅影响训练后测试通道上报告的准确性分数。值越小,评估越快,但评估分数通常会更差且更不确定。当使用更高的分位数(例如 0.95)进行评估时,增加评估样本的数量可能会非常重要。 可选 有效值:整数 默认值:100 |
num_layers |
RNN 中的隐藏层数。典型值范围为 1 到 4。 可选 有效值:正整数 默认值:2 |
test_quantiles |
用于计算测试通道上的分位数损失的分位数。 可选 有效值:浮点数数组 默认值:[0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9] |