Ajustar un Modelo de Información IP - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ajustar un Modelo de Información IP

Ajuste de modelo automático, también llamado ajuste de hiperparámetro, encuentra la mejor versión de un modelo ejecutando muchas tareas que prueban una serie de hiperparámetros en su conjunto de datos. Usted elige los hiperparámetros que pueden ajustarse, un rango de valores para cada uno de ellos y una métrica objetiva. Puede elegir la métrica objetiva de las métricas que el algoritmo computa. El ajuste de modelo automático busca los hiperparámetros elegidos para encontrar la combinación de valores que obtienen el modelo que optimiza la métrica objetiva.

Para obtener más información acerca del ajuste de modelos, consulte Ajuste automático del modelo con SageMaker.

Las métricas computadas por el Algoritmo de Información IP

El algoritmo Amazon SageMaker IP Insights es un algoritmo de aprendizaje no supervisado que aprende las asociaciones entre direcciones IP y entidades. El algoritmo capacita a un modelo discriminador, que aprende a separar puntos de datos observados (muestraspositivas) de puntos de datos generados de forma aleatoria (muestrasnegativas). El ajuste de modelo automático en Información IP le ayuda a encontrar el modelo que puede distinguir con mayor precisión entre datos de validación no etiquetados y muestras negativas generadas automáticamente. La precisión del modelo en el conjunto de datos de validación se mide mediante el área bajo la curva Receiver Operating Characteristic. Esta métrica validation:discriminator_auc puede tomar valores entre 0,0 y 1,0, donde 1,0 indica precisión perfecta.

El algoritmo IP Información calcula una métrica validation:discriminator_auc durante la validación, el valor que se utiliza como la función objetiva para optimizar para ajuste del hiperparámetro.

Nombre de métrica Descripción Dirección de optimización
validation:discriminator_auc

Área bajo la curva Receiver Operating Characteristic en el conjunto de datos de validación. El conjunto de datos de validación no está etiquetado. Area Under the Curve (AUC) es una métrica que describe la capacidad del modelo para distinguir puntos de datos de validación de puntos de datos generados de forma aleatoria.

Maximizar

Hiperparámetros de Información IP ajustables

Puede ajustar los siguientes hiperparámetros para el algoritmo SageMaker IP Insights.

Nombre del parámetro Tipo de parámetro Intervalos recomendados
epochs

IntegerParameterRange

MinValue: 1, MaxValue 100

learning_rate

ContinuousParameterRange

MinValue: 1e-4, MaxValue: 0,1

mini_batch_size

IntegerParameterRanges

MinValue: 100, 5000 MaxValue

num_entity_vectors

IntegerParameterRanges

MinValue: 1000, MaxValue 1000000

num_ip_encoder_layers

IntegerParameterRanges

MinValue: 1, MaxValue 10

random_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue 10

shuffled_negative_sampling_rate

IntegerParameterRanges

MinValue: 0, MaxValue 10

vector_dim

IntegerParameterRanges

MinValue: 8, MaxValue 256

weight_decay

ContinuousParameterRange

MinValue: 0,0, MaxValue 1,0