Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Hiperparámetros de aprendizaje lineal
La siguiente tabla contiene los hiperparámetros del algoritmo de aprendizaje lineal. Estos son los parámetros que establecen los usuarios para facilitar la estimación de los parámetros del modelo a partir de los datos. Los hiperparámetros necesarios que deben establecerse se enumerarán en primer lugar, en orden alfabético. Los hiperparámetros opcionales que se pueden establecer aparecen a continuación en la lista, también en orden alfabético. Cuando un hiperparámetro se establece enauto
, Amazon SageMaker calculará y establecerá automáticamente el valor de ese hiperparámetro.
Nombre del parámetro | Descripción |
---|---|
num_classes |
El número de clases para la respuesta variable. El algoritmo presupone que las clases se etiquetan Obligatorio cuando Valores válidos: Enteros comprendidos entre 3 y 1 000 000. |
predictor_type |
Especifica el tipo de variable de destino como una clasificación binaria, clasificación de varias clases, o regresión. Obligatorio Valores válidos: |
accuracy_top_k |
A la hora de calcular la métrica de precisión de top-k para la clasificación de varias clases, el valor de k. Si el modelo asigna una de las puntuaciones top-k a la verdadera etiqueta, el ejemplo será puntuado como correcto. Opcional Valores válidos: enteros positivos Valor predeterminado: 3 |
balance_multiclass_weights |
Especifica si se debe usar ponderaciones de clase, que proporcionan a cada clase igual importancia en la función de pérdida. Solo se usa cuando el Opcional Valores válidos: Valor predeterminado: |
beta_1 |
Tasa de decremento exponencial para las estimaciones del primer momento. Se aplica solo cuando el valor de Opcional Valores válidos: Valor predeterminado: |
beta_2 |
Tasa de decremento exponencial para las estimaciones de segundo momento. Se aplica solo cuando el valor de Opcional Valores válidos: Valor predeterminado: |
bias_lr_mult |
Permite una tasa de aprendizaje diferente para el plazo de sesgo. La tasa de aprendizaje real para el sesgo es Opcional Valores válidos: Valor predeterminado: |
bias_wd_mult |
Permite una regularización diferente para el plazo de sesgo. La ponderación de regularización de L2 real para el sesgo es Opcional Valores válidos: Valor predeterminado: |
binary_classifier_model_selection_criteria |
Cuando
Opcional Valores válidos: Valor predeterminado: |
early_stopping_patience |
El número de fechas de inicio para esperar antes de finalizar la capacitación si no se realiza ninguna mejora en la métrica relevante. Si ha proporcionado un valor para binary_classifier_model_selection_criteria . la métrica es dicho valor. De lo contrario, la métrica es la misma que el valor especificado para el hiperparámetro loss . La métrica se evalúa en los datos de validación. Si no ha proporcionado datos de validación, la métrica siempre la misma que el valor especificado para el hiperparámetro Opcional Valores válidos: número entero positivo Valor predeterminado: 3 |
early_stopping_tolerance |
Tolerancia relativa para medir una mejora en la pérdida. Si la proporción de la mejora en la pérdida dividida por la mejor pérdida anterior es inferior a este valor, la detención precoz considera que la mejora es cero. Opcional Valores válidos: Entero positivo de punto flotante Valor predeterminado: 0.001 |
epochs |
Número máximo de iteraciones en los datos de capacitación. Opcional Valores válidos: número entero positivo Valor predeterminado: 15 |
f_beta |
El valor de beta que se ha de emplear al calcular las métricas de puntuación F para la clasificación binaria o de varias clases. También se utiliza si el valor definido para Opcional Valores válidos: enteros positivos de punto flotante Valor predeterminado: 1.0 |
feature_dim |
El número de características en los datos de entrada. Opcional Valores válidos: Valores predeterminados: |
huber_delta |
El parámetro de pérdida de Huber. Durante la evaluación métrica y de capacitación, compute la pérdida L2 de errores inferiores a delata y de pérdida L1 de errores superiores a delta. Opcional Valores válidos: Entero positivo de punto flotante Valor predeterminado: 1.0 |
init_bias |
Ponderación inicial para el plazo de sesgo. Opcional Valores válidos: Entero de punto flotante Valor predeterminado: 0 |
init_method |
Establece la función de distribución inicial que se utiliza para ponderaciones de modelo. Las funciones incluyen:
Opcional Valores válidos: Valor predeterminado: |
init_scale |
Escala una distribución uniforme para ponderaciones de modelo. Se aplica solo cuando se establece el hiperparámetro Opcional Valores válidos: Entero positivo de punto flotante Valor predeterminado: 0.07 |
init_sigma |
La desviación estándar inicial para la distribución normal. Se aplica solo cuando se establece el hiperparámetro Opcional Valores válidos: Entero positivo de punto flotante Valor predeterminado: 0,01 |
l1 |
El parámetro de regularización de L1. Si no desea utilizar la regularización de L1, establezca el valor en 0. Opcional Valores válidos: Valor predeterminado: |
learning_rate |
El tamaño del paso usado por el optimizador para actualizaciones de parámetros. Opcional Valores válidos: Valor predeterminado: |
loss |
Especifica la función de pérdida. Las funciones de pérdida disponibles y sus valores predeterminados dependen del valor de
Valores válidos: Opcional Valor predeterminado: |
loss_insensitivity |
El parámetro para el tipo de pérdida epsilon-insensible. Durante la evaluación métrica y de capacitación, cualquier error inferior a este valor se considera cero. Opcional Valores válidos: Entero positivo de punto flotante Valor predeterminado: 0,01 |
lr_scheduler_factor |
Para cada hiperparámetro Opcional Valores válidos: Valor predeterminado: |
lr_scheduler_minimum_lr |
La tasa de aprendizaje nunca disminuye a un valor inferior al valor establecido para Opcional Valores válidos: Valores predeterminados: |
lr_scheduler_step |
El número de pasos entre disminuciones de la tasa de aprendizaje. Se aplica solo cuando se establece el hiperparámetro Opcional Valores válidos: Valor predeterminado: |
margin |
El margen para la función Opcional Valores válidos: Entero positivo de punto flotante Valor predeterminado: 1.0 |
mini_batch_size |
El número de observaciones por minilote para el iterador de datos. Opcional Valores válidos: número entero positivo Valor predeterminado: 1000 |
momentum |
El impulso del optimizador Opcional Valores válidos: Valor predeterminado: |
normalize_data |
Normaliza los datos de la característica antes de la capacitación. La normalización de los datos convierte los datos de cada característica para que tengan una media de cero y los escala para que tenga la desviación estándar de la unidad. Opcional Valores válidos: Valor predeterminado: |
normalize_label |
Normaliza la etiqueta. La normalización de las etiquetas cambia la etiqueta para que tenga una media de cero y la escala para que tenga la desviación estándar de la unidad. El valor Opcional Valores válidos: Valor predeterminado: |
num_calibration_samples |
Número de observaciones del conjunto de datos de validación para usar en la calibración de modelo (cuando se encuentra el mejor umbral). Opcional Valores válidos: Valor predeterminado: |
num_models |
Número de modelos para capacitación en paralelo. Para el valor predeterminado, Opcional Valores válidos: Valores predeterminados: |
num_point_for_scaler |
El número de puntos de datos a usar para calcular la normalización o para establecer plazos sin sesgo. Opcional Valores válidos: número entero positivo Valor predeterminado: 10,000 |
optimizer |
El algoritmo de optimización que se va a utilizar. Opcional Valores válidos:
Valor predeterminado: |
positive_example_weight_mult |
La ponderación asignada a ejemplos positivos cuando se capacita un clasificador binario. La ponderación de los ejemplos negativos se fija en 1. Si desea que el algoritmo elija una ponderación de manera que los errores en los ejemplos de clasificación negativos frente a positivos tenga el mismo impacto en la pérdida de capacitación, especifique Opcional Valores válidos: Valor predeterminado: 1.0 |
quantile |
El cuantil para pérdida de cuantil. Para el cuantil q, el modelo intenta producir predicciones de modo que el valor de Opcional Valores válidos: entero de punto flotante comprendido entre 0 y 1 Valor predeterminado: 0,5 |
target_precision |
La precisión de destino. Si Opcional Valores válidos: Entero de punto flotante comprendido entre 0 y 1,0 Valor predeterminado: 0.8 |
target_recall |
La rellamada de destino. Si Opcional Valores válidos: Entero de punto flotante comprendido entre 0 y 1,0 Valor predeterminado: 0.8 |
unbias_data |
Establece las características sin sesgo antes de la capacitación de modo que la media sea 0. De forma predeterminada, los datos no están sesgados si el hiperparámetro Opcional Valores válidos: Valor predeterminado: |
unbias_label |
Establece las etiquetas sin sesgo antes de la capacitación de modo que la media sea 0. Se aplica a la regresión solo si el Opcional Valores válidos: Valor predeterminado: |
use_bias |
Especifica si el modelo debe incluir un término de sesgo, que es el término interceptar en la ecuación lineal. Opcional Valores válidos: Valor predeterminado: |
use_lr_scheduler |
Cuándo usar un programador para la tasa de aprendizaje. Si desea utilizar un programador, especifique Opcional Valores válidos: Valor predeterminado: |
wd |
El parámetro de degradación de ponderación, que también se conoce como parámetro de regularización de L2. Si no desea utilizar la regularización de L2, establezca el valor en 0. Opcional Valores válidos: Valor predeterminado: |