Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Ajustar un Modelo de Información IP
Ajuste de modelo automático, también llamado ajuste de hiperparámetro, encuentra la mejor versión de un modelo ejecutando muchas tareas que prueban una serie de hiperparámetros en su conjunto de datos. Usted elige los hiperparámetros que pueden ajustarse, un rango de valores para cada uno de ellos y una métrica objetiva. Puede elegir la métrica objetiva de las métricas que el algoritmo computa. El ajuste de modelo automático busca los hiperparámetros elegidos para encontrar la combinación de valores que obtienen el modelo que optimiza la métrica objetiva.
Para obtener más información acerca del ajuste de modelos, consulte Ajuste automático del modelo con SageMaker.
Las métricas computadas por el Algoritmo de Información IP
El algoritmo Amazon SageMaker IP Insights es un algoritmo de aprendizaje no supervisado que aprende las asociaciones entre direcciones IP y entidades. El algoritmo capacita a un modelo discriminador, que aprende a separar puntos de datos observados (muestraspositivas) de puntos de datos generados de forma aleatoria (muestrasnegativas). El ajuste de modelo automático en Información IP le ayuda a encontrar el modelo que puede distinguir con mayor precisión entre datos de validación no etiquetados y muestras negativas generadas automáticamente. La precisión del modelo en el conjunto de datos de validación se mide mediante el área bajo la curva Receiver Operating Characteristic. Esta métrica validation:discriminator_auc
puede tomar valores entre 0,0 y 1,0, donde 1,0 indica precisión perfecta.
El algoritmo IP Información calcula una métrica validation:discriminator_auc
durante la validación, el valor que se utiliza como la función objetiva para optimizar para ajuste del hiperparámetro.
Nombre de métrica | Descripción | Dirección de optimización |
---|---|---|
validation:discriminator_auc |
Área bajo la curva Receiver Operating Characteristic en el conjunto de datos de validación. El conjunto de datos de validación no está etiquetado. Area Under the Curve (AUC) es una métrica que describe la capacidad del modelo para distinguir puntos de datos de validación de puntos de datos generados de forma aleatoria. |
Maximizar |
Hiperparámetros de Información IP ajustables
Puede ajustar los siguientes hiperparámetros para el algoritmo SageMaker IP Insights.
Nombre del parámetro | Tipo de parámetro | Intervalos recomendados |
---|---|---|
epochs |
IntegerParameterRange |
MinValue: 1, MaxValue 100 |
learning_rate |
ContinuousParameterRange |
MinValue: 1e-4, MaxValue: 0,1 |
mini_batch_size |
IntegerParameterRanges |
MinValue: 100, 5000 MaxValue |
num_entity_vectors |
IntegerParameterRanges |
MinValue: 1000, MaxValue 1000000 |
num_ip_encoder_layers |
IntegerParameterRanges |
MinValue: 1, MaxValue 10 |
random_negative_sampling_rate |
IntegerParameterRanges |
MinValue: 0, MaxValue 10 |
shuffled_negative_sampling_rate |
IntegerParameterRanges |
MinValue: 0, MaxValue 10 |
vector_dim |
IntegerParameterRanges |
MinValue: 8, MaxValue 256 |
weight_decay |
ContinuousParameterRange |
MinValue: 0,0, MaxValue 1,0 |