本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Anthropic Claude 3 模型自定义超参数
Anthropic Claude 3 模型支持以下用于自定义模型的超参数:
控制台名称 | API 名称 | 定义 | 默认 | 最小值 | 最大值 |
---|---|---|---|---|---|
周期计数 | epochCount | 整个训练数据集的最大迭代次数 | 2 | 1 | 10 |
批次大小 | batchSize | 更新模型参数之前处理的样本数 | 32 | 4 | 256 |
学习率乘数 | learningRateMultiplier | 该乘数会影响模型参数在每个批次之后更新的学习率 | 1 | 0.1 | 2 |
提前停止阈值 | earlyStoppingThreshold | 防止训练过程过早终止所需的最低验证损失改善 | 0.001 | 0 | 0.1 |
提前停止容忍度 | earlyStoppingPatience | 停止训练过程之前对验证损失指标停滞的容忍程度 | 2 | 1 | 10 |