Hiperparámetros de máquinas de factorización - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Hiperparámetros de máquinas de factorización

La siguiente tabla contiene los hiperparámetros para el algoritmo de máquinas de factorización. Estos son los parámetros que establecen los usuarios para facilitar la estimación de los parámetros del modelo a partir de los datos. Los hiperparámetros necesarios que deben establecerse se enumerarán en primer lugar, en orden alfabético. Los hiperparámetros opcionales que se pueden establecer aparecen a continuación en la lista, también en orden alfabético.

Nombre del parámetro Descripción
feature_dim

La dimensión del espacio de características de entrada. Podría tener un valor alto con la entrada dispersa.

Obligatorio

Valores válidos: número entero positivo Rango de valor sugerido: [10000,10000000]

num_factors

La dimensionalidad de la factorización.

Obligatorio

Valores válidos: número entero positivo Rango de valores sugerido: [2,1000], 64 normalmente genera buenos resultados y es un buen punto de partida.

predictor_type

El tipo de elemento de predicción.

  • binary_classifier: para tareas de clasificación binaria

  • regressor: para tareas de regresión.

Obligatorio

Valores válidos: String binary_classifier o regressor

bias_init_method

El método de inicialización para el plazo de sesgo:

  • normal: inicializa las ponderaciones con valores aleatorios de muestra desde una distribución normal con una media de cero y una desviación estándar especificada por bias_init_sigma.

  • uniform: inicializa las ponderaciones con valores aleatorios de muestra uniforme desde un rango especificado por [-bias_init_scale, +bias_init_scale].

  • constant: inicializa las ponderaciones en un valor escalar especificado por bias_init_value.

Opcional

Valores válidos: uniform, normal o constant

Valor predeterminado: normal

bias_init_scale

Rango de la inicialización del plazo de sesgo. Surte efecto si bias_init_method está establecido en uniform.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: ninguno

bias_init_sigma

La desviación estándar para la inicialización del plazo de sesgo. Surte efecto si bias_init_method está establecido en normal.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: 0,01

bias_init_value

El valor inicial del plazo de sesgo. Surte efecto si bias_init_method está establecido en constant.

Opcional

Valores válidos: número flotante. Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: ninguno

bias_lr

La tasa de aprendizaje para el plazo de sesgo.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: 0.1

bias_wd

El decremento de ponderación para el plazo de sesgo.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: 0,01

clip_gradient

Parámetro del optimizador de recorte de gradientes. Recorta el gradiente proyectándolo en el intervalo [-clip_gradient, +clip_gradient].

Opcional

Valores válidos: número flotante

Valor predeterminado: ninguno

epochs

El número de fechas de inicio de capacitación que ejecutar.

Opcional

Valores válidos: número entero positivo

Valor predeterminado: 1

eps

Parámetro de valores epsilon para evitar la división por 0.

Opcional

Valores válidos: número flotante. Valor sugerido: pequeño.

Valor predeterminado: ninguno

factors_init_method

El método de inicialización para los plazos de factorización:

  • normal: inicializa las ponderaciones con valores aleatorios de muestra desde una distribución normal con una media de cero y una desviación estándar especificada por factors_init_sigma.

  • uniform: inicializa las ponderaciones con valores aleatorios de muestra uniforme desde un rango especificado por [-factors_init_scale, +factors_init_scale].

  • constant: inicializa las ponderaciones en un valor escalar especificado por factors_init_value.

Opcional

Valores válidos: uniform, normal o constant.

Valor predeterminado: normal

factors_init_scale

El rango de la inicialización de los plazos de factorización. Surte efecto si factors_init_method está establecido en uniform.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: ninguno

factors_init_sigma

La desviación estándar para la inicialización de los plazos de factorización. Surte efecto si factors_init_method está establecido en normal.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: 0.001

factors_init_value

El valor inicial de los plazos de factorización. Surte efecto si factors_init_method está establecido en constant.

Opcional

Valores válidos: número flotante. Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: ninguno

factors_lr

La tasa de aprendizaje para los plazos de factorización.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: 0.0001

factors_wd

El decremento de ponderación para los plazos de factorización.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: 0.00001

linear_lr

La tasa de aprendizaje para plazos lineales.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: 0.001

linear_init_method

El método de inicialización para los plazos lineales:

  • normal: inicializa las ponderaciones con valores aleatorios de muestra desde una distribución normal con una media de cero y una desviación estándar especificada por linear_init_sigma.

  • uniform: inicializa las ponderaciones con valores aleatorios de muestra uniforme desde un rango especificado por [-linear_init_scale, +linear_init_scale].

  • constant: inicializa las ponderaciones en un valor escalar especificado por linear_init_value.

Opcional

Valores válidos: uniform, normal o constant.

Valor predeterminado: normal

linear_init_scale

Rango de la inicialización de los plazos lineales. Surte efecto si linear_init_method está establecido en uniform.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: ninguno

linear_init_sigma

La desviación estándar para la inicialización de los plazos lineales. Surte efecto si linear_init_method está establecido en normal.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: 0,01

linear_init_value

El valor inicial de los plazos lineales. Surte efecto si se establece linear_init_method en constante.

Opcional

Valores válidos: número flotante. Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: ninguno

linear_wd

El decremento de ponderación para los plazos lineales.

Opcional

Valores válidos: número flotante no negativo Rango de valor sugerido: [1e-8, 512]

Valor predeterminado: 0.001

mini_batch_size

El tamaño del minilote utilizado para la capacitación.

Opcional

Valores válidos: número entero positivo

Valor predeterminado: 1000

rescale_grad

Parámetro del optimizador de reescalado de gradientes. Si se establece, multiplica el gradiente con rescale_grad antes de la actualización. Seleccione con frecuencia que sea 1,0/batch_size.

Opcional

Valores válidos: número flotante

Valor predeterminado: ninguno