本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Anthropic Claude 3 模型自定义超参数
Anthropic Claude 3 模型支持以下用于模型自定义的超参数:
控制台名称 | API 名称 | 定义 | 默认 | 最低 | 最高 |
---|---|---|---|---|---|
纪元计数 | epochCount | 整个训练数据集的最大迭代次数 | 2 | 1 | 10 |
批次大小 | batchSize | 更新模型参数之前处理的样本数 | 32 | 4 | 256 |
学习率乘数 | learningRateMultiplier | 影响每批次更新模型参数的学习速率的乘数 | 1 | 0.1 | 2 |
提前停止阈值 | earlyStoppingThreshold | 防止培训过程过早终止所需的验证损失减少到最低限度 | 0.001 | 0 | 0.1 |
提早停止耐心 | earlyStoppingPatience | 在停止训练过程之前,允许验证丢失指标停滞不前 | 2 | 1 | 10 |