Anthropic Claude 3 模型自定义超参数 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Anthropic Claude 3 模型自定义超参数

Anthropic Claude 3 模型支持以下用于自定义模型的超参数:

控制台名称 API 名称 定义 默认 最小值 最大值
周期计数 epochCount 整个训练数据集的最大迭代次数 2 1 10
批次大小 batchSize 更新模型参数之前处理的样本数 32 4 256
学习率乘数 learningRateMultiplier 该乘数会影响模型参数在每个批次之后更新的学习率 1 0.1 2
提前停止阈值 earlyStoppingThreshold 防止训练过程过早终止所需的最低验证损失改善 0.001 0 0.1
提前停止容忍度 earlyStoppingPatience 停止训练过程之前对验证损失指标停滞的容忍程度 2 1 10