Ajuste del modelo: ajustes deficientes vs. ajustes excesivos - Amazon Machine Learning

Ya no actualizamos el servicio Amazon Machine Learning ni aceptamos nuevos usuarios para él. Esta documentación está disponible para los usuarios actuales, pero ya no la actualizamos. Para obtener más información, consulte Qué es Amazon Machine Learning.

Ajuste del modelo: ajustes deficientes vs. ajustes excesivos

Comprender el ajuste del modelo es importante para comprender la causa raíz para una precisión deficiente del modelo. Esta información le ayudará a tomar medidas correctivas. Podemos determinar si un modelo predictivo presenta un ajuste deficiente o un ajuste excesivo de los datos de entrenamiento observando el error de predicción en los datos de entrenamiento y los datos de evaluación.

Three graphs showing underfitting, balanced, and overfitting models with data points and trend lines.

El modelo presenta ajustes deficientes en los datos de aprendizaje cuando el modelo presenta un rendimiento deficiente en los datos de aprendizaje. Esto se debe a que el modelo no puede capturar la relación entre los ejemplos de entrada (a menudo llamados X) y los valores de destino (a menudo llamados Y). El modelo presenta ajustes excesivos en los datos de entrenamiento cuando el modelo presenta un buen rendimiento con los datos de entrenamiento pero no con los datos de evaluación. Esto se debe a que el modelo memoriza los datos que ha visto y no puede generalizar para los ejemplos no vistos.

Un rendimiento deficiente en los datos de aprendizaje podría deberse a que el modelo es demasiado sencillo (las características de entrada no son suficientemente expresivas) como para describir el destino adecuadamente. El rendimiento se puede mejorar aumentando la flexibilidad. Para aumentar la flexibilidad del modelo, pruebe lo siguiente:

  • Añada nuevas características específicas del dominio y más productos cartesianos de características, y cambie los tipos de procesamiento de características utilizado (por ejemplo, aumentando el tamaño n-grams).

  • Reduzca la cantidad de regularización utilizada.

Si el modelo presenta ajustes excesivos en los datos de entrenamiento, es razonable tomar medida que reduzcan la flexibilidad del modelo. Para reducir la flexibilidad del modelo, pruebe lo siguiente:

  • Selección de características: considerar el uso de combinaciones de características, la reducción del tamaño n-grams y la reducción del número de contenedores de atributos.

  • Aumente la cantidad de regularización utilizada.

La precisión en los datos de entrenamiento y prueba podría ser deficiente porque el algoritmo de aprendizaje no tenía datos suficientes de los que aprender. Podría mejorar el rendimiento haciendo lo siguiente:

  • Aumentar el número de ejemplos de datos de entrenamiento.

  • Aumentar el número de pases en los datos de entrenamiento existentes.