Ajustar un modelo de aprendizaje lineal - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ajustar un modelo de aprendizaje lineal

El ajuste de modelo automático, también conocido como ajuste de hiperparámetros, encuentra la mejor versión de un modelo ejecutando muchas tareas que probar una serie de hiperparámetros en su conjunto de datos. Usted elige los hiperparámetros que pueden ajustarse, un rango de valores para cada uno de ellos y una métrica objetiva. Puede elegir la métrica objetiva de las métricas que el algoritmo computa. El ajuste de modelo automático busca los hiperparámetros elegidos para encontrar la combinación de valores que obtienen el modelo que optimiza la métrica objetiva.

El algoritmo de aprendizaje lineal también dispone de un mecanismo interno para ajustar hiperparámetros independiente del ajuste de modelo automático que se describe aquí. De forma predeterminada, el algoritmo de aprendizaje lineal ajusta hiperparámetros capacitando varios modelos en paralelo. Cuando se utiliza ajuste de modelos automático, el mecanismo de ajuste de aprendizaje lineal interno está desactivado de forma automática. Esto establece el número de modelos paralelos, num_models, a 1. El algoritmo no tiene en cuenta los valores que establezca para num_models.

Para obtener más información acerca del ajuste de modelos, consulte Ajuste automático del modelo con SageMaker.

Métricas computadas por el algoritmo de aprendizaje lineal

El algoritmo de aprendizaje lineal informa de la las métricas en la siguiente tabla, que se calcula durante la capacitación. Elija uno de ellos como métrica objetivo. Para evitar sobreajustes, se recomienda ajustar el modelo en una métrica de validación en lugar de una capacitación métrica.

Nombre de métrica Descripción Dirección de optimización
test:absolute_loss

La pérdida absoluta del modelo final en el conjunto de datos de prueba. Esta métrica objetivo solo es válida para regresión.

Minimizar

test:binary_classification_accuracy

La precisión del modelo final en el conjunto de datos de prueba. Esta métrica objetivo solo es válida para la clasificación binaria.

Maximizar

test:binary_f_beta

La puntuación F-beta del modelo final en el conjunto de datos de prueba. De forma predeterminada, se trata de la puntuación F1, que es la media armónica de la precisión y la recuperación. Esta métrica objetivo solo es válida para la clasificación binaria.

Maximizar

test:dcg

La ganancia acumulada descontada del modelo final en el conjunto de datos de prueba. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

test:macro_f_beta

La puntuación F-beta del modelo final en el conjunto de datos de prueba. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

test:macro_precision

La precisión del modelo final en el conjunto de datos de prueba. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

test:macro_recall

La puntuación de exhaustividad del modelo final en el conjunto de datos de prueba. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

test:mse

El error cuadrático medio del modelo final en el conjunto de datos de prueba. Esta métrica objetivo solo es válida para regresión.

Minimizar

test:multiclass_accuracy

La precisión del modelo final en el conjunto de datos de prueba. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

test:multiclass_top_k_accuracy

La precisión entre las k etiquetas principales pronosticadas en el conjunto de datos de prueba. Si elige esta métrica como objetivo, le recomendamos establecer el valor de k mediante el hiperparámetro accuracy_top_k. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

test:objective_loss

El valor medio del función de pérdida objetivo en el conjunto de datos de prueba después de que el modelo sea capacitado. De forma predeterminada, la pérdida es la pérdida logística para clasificación binaria y pérdida cuadrática para regresión. Para establecer la pérdida a otros tipos, utilice el loss hiperparámetro.

Minimizar

test:precision

La precisión del modelo final en el conjunto de datos de prueba. Si elige esta métrica como objetivo, recomendamos configurar una rellamada objetivo estableciendo el binary_classifier_model_selection hiperparámetro en precision_at_target_recall y definir el valor para el target_recall hiperparámetro. Esta métrica objetivo solo es válida para la clasificación binaria.

Maximizar

test:recall

La rellamada del modelo final en el conjunto de datos de prueba. Si elige esta métrica como objetivo, recomendamos configurar una precisión objetivo estableciendo el hiperparámetro binary_classifier_model_selection en recall_at_target_precision y definiendo el valor para el hiperparámetro target_precision. Esta métrica objetivo solo es válida para la clasificación binaria.

Maximizar

test:roc_auc_score

El área bajo la curva característica operativa receptora (curva ROC) del modelo final en el conjunto de datos de prueba. Esta métrica objetivo solo es válida para la clasificación binaria.

Maximizar

validation:absolute_loss

La pérdida absoluta del modelo final en el conjunto de datos de validación. Esta métrica objetivo solo es válida para regresión.

Minimizar

validation:binary_classification_accuracy

La precisión del modelo final en la validación del conjunto de datos de prueba. Esta métrica objetivo solo es válida para la clasificación binaria.

Maximizar

validation:binary_f_beta

La puntuación F-beta del modelo final en la validación del conjunto de datos. De forma predeterminada, la puntuación F-beta es la puntuación F1, que es la media armónica de las métricas validation:recall y validation:precision. Esta métrica objetivo solo es válida para la clasificación binaria.

Maximizar

validation:dcg

La ganancia acumulada descontada del modelo final en el conjunto de datos de validación. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

validation:macro_f_beta

La puntuación F-beta del modelo final en la validación del conjunto de datos. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

validation:macro_precision

La puntuación de precisión del modelo final en el conjunto de datos de validación. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

validation:macro_recall

La puntuación de exhaustividad del modelo final en el conjunto de datos de validación. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

validation:mse

El error cuadrático medio del modelo final en el conjunto de datos de validación. Esta métrica objetivo solo es válida para regresión.

Minimizar

validation:multiclass_accuracy

La precisión del modelo final en la validación del conjunto de datos de prueba. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

validation:multiclass_top_k_accuracy

La precisión entre las k etiquetas principales pronosticadas en el conjunto de datos de validación. Si elige esta métrica como objetivo, le recomendamos establecer el valor de k mediante el hiperparámetro accuracy_top_k. Esta métrica objetivo solo es válida para la clasificación multiclase.

Maximizar

validation:objective_loss

El valor medio de la función de pérdida objetivo en el conjunto de datos de validación de cada fecha de inicio. De forma predeterminada, la pérdida es la pérdida logística para clasificación binaria y pérdida cuadrática para regresión. Para establecer la pérdida a otros tipos, utilice el loss hiperparámetro.

Minimizar

validation:precision

La precisión del modelo final en el conjunto de datos de validación. Si elige esta métrica como objetivo, recomendamos configurar una rellamada objetivo estableciendo el binary_classifier_model_selection hiperparámetro en precision_at_target_recall y definir el valor para el target_recall hiperparámetro. Esta métrica objetivo solo es válida para la clasificación binaria.

Maximizar

validation:recall

La precisión del modelo final en el conjunto de datos de validación. Si elige esta métrica como objetivo, recomendamos configurar una precisión objetivo estableciendo el hiperparámetro binary_classifier_model_selection en recall_at_target_precision y definiendo el valor para el hiperparámetro target_precision. Esta métrica objetivo solo es válida para la clasificación binaria.

Maximizar

validation:rmse

La raíz del error cuadrático medio del modelo final en el conjunto de datos de validación. Esta métrica objetivo solo es válida para regresión.

Minimizar

validation:roc_auc_score

El área bajo la curva característica operativa receptora (curva ROC) del modelo final en el conjunto de datos de validación. Esta métrica objetivo solo es válida para la clasificación binaria.

Maximizar

Ajuste de hiperparámetros de aprendizaje lineal

Puede ajustar un modelo de aprendizaje lineal con los siguientes hiperparámetros.

Nombre del parámetro Tipo de parámetro Intervalos recomendados
wd

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

l1

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

learning_rate

ContinuousParameterRanges

MinValue: 1e-5, MaxValue: 1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue: 5000

use_bias

CategoricalParameterRanges

[True, False]

positive_example_weight_mult

ContinuousParameterRanges

MinValue: 1e-5, MaxValue: 1e5