Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Hiperparámetros de personalización del modelo de Titan texto de Amazon
El modelo Amazon Titan Text Premier admite los siguientes hiperparámetros para la personalización del modelo:
Hiperparámetro (consola) | Hiperparámetro (API) | Definición | Tipo | Mínimo | Máximo | Predeterminado |
---|---|---|---|---|---|---|
Épocas | epochCount | El número de iteraciones en todo el conjunto de datos de entrenamiento | integer | 1 | 5 | 2 |
Tamaño de lote (micro) | batchSize | El número de muestras procesadas antes de actualizar los parámetros del modelo | integer | 1 | 1 | 1 |
Tasa de aprendizaje | learningRate | La velocidad a la que se actualizan los parámetros del modelo después de cada lote | float | 1.00E-07 | 1.00E-05 | 1,00E-06 |
Pasos de calentamiento de la tasa de aprendizaje | Pasos de aprendizaje RateWarmup | El número de iteraciones durante las que la tasa de aprendizaje aumenta gradualmente hasta alcanzar la tasa especificada | integer | 0 | 20 | 5 |
Los modelos Amazon Titan Text, como Lite y Express, admiten los siguientes hiperparámetros para la personalización del modelo:
Hiperparámetro (consola) | Hiperparámetro (API) | Definición | Tipo | Mínimo | Máximo | Predeterminado |
---|---|---|---|---|---|---|
Épocas | epochCount | El número de iteraciones en todo el conjunto de datos de entrenamiento | integer | 1 | 10 | 5 |
Tamaño de lote (micro) | batchSize | El número de muestras procesadas antes de actualizar los parámetros del modelo | integer | 1 | 64 | 1 |
Tasa de aprendizaje | learningRate | La velocidad a la que se actualizan los parámetros del modelo después de cada lote | float | 0.0 | 1 | 1,00E-5 |
Pasos de calentamiento de la tasa de aprendizaje | RateWarmupPasos de aprendizaje | El número de iteraciones durante las que la tasa de aprendizaje aumenta gradualmente hasta alcanzar la tasa especificada | integer | 0 | 250 | 5 |