Ajuste un modelo BlazingText - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Ajuste un modelo BlazingText

El ajuste de modelo automático, también conocido como ajuste de hiperparámetros, encuentra la mejor versión de un modelo ejecutando muchas tareas que probar una serie de hiperparámetros en su conjunto de datos. Usted elige los hiperparámetros que pueden ajustarse, un rango de valores para cada uno de ellos y una métrica objetiva. Puede elegir la métrica objetiva de las métricas que el algoritmo computa. El ajuste de modelo automático busca los hiperparámetros elegidos para encontrar la combinación de valores que obtienen el modelo que optimiza la métrica objetiva.

Para obtener más información acerca del ajuste de modelos, consulte Ajuste automático del modelo con SageMaker.

Métricas calculadas por el algoritmo BlazingText

El algoritmo BlazingText Word2Vec (skipgramcbow, y los batch_skipgram modos) informa sobre una sola métrica durante el entrenamiento:. train:mean_rho Esta métrica se computa en conjuntos de datos de WS-353 de similitud de palabras. Al ajustar los valores del hiperparámetro para el algoritmo Word2Vec, utilice esta métrica como la métrica objetiva.

El algoritmo de clasificación de BlazingText textos (supervisedmodo) también informa sobre una única métrica durante el entrenamiento: la. validation:accuracy Al ajustar los valores del hiperparámetro para el algoritmo de clasificación de texto, utilice estas métricas como la métrica objetiva.

Nombre de métrica Descripción Dirección de optimización
train:mean_rho

La ro media (coeficiente de correlación de clasificación de Spearman) en conjuntos de datos de WS-353 de similitud de palabras

Maximizar

validation:accuracy

La precisión de clasificación en el conjunto de datos de validación especificado por el usuario

Maximizar

Hiperparámetros ajustables BlazingText

Hiperparámetros ajustables para el algoritmo Word2Vec

Ajuste un modelo de Amazon SageMaker BlazingText Word2Vec con los siguientes hiperparámetros. Los hiperparámetros con el mayor impacto en métricas objetivas de Word2Vec son: mode, learning_rate, window_size, vector_dim y negative_samples.

Nombre del parámetro Tipo de parámetro Rangos o valores recomendados
batch_size

IntegerParameterRange

[8-32]

epochs

IntegerParameterRange

[5-15]

learning_rate

ContinuousParameterRange

MinValue: 0,005,: 0,01 MaxValue

min_count

IntegerParameterRange

[0-100]

mode

CategoricalParameterRange

['batch_skipgram', 'skipgram', 'cbow']

negative_samples

IntegerParameterRange

[5-25]

sampling_threshold

ContinuousParameterRange

MinValue: 0,0001, MaxValue 0,001

vector_dim

IntegerParameterRange

[32-300]

window_size

IntegerParameterRange

[1-10]

Hiperparámetros ajustables para el algoritmo de clasificación de texto

Ajuste un modelo de clasificación de SageMaker BlazingText textos de Amazon con los siguientes hiperparámetros.

Nombre del parámetro Tipo de parámetro Rangos o valores recomendados
buckets

IntegerParameterRange

[1000000-10000000]

epochs

IntegerParameterRange

[5-15]

learning_rate

ContinuousParameterRange

MinValue: 0,005, MaxValue: 0,01

min_count

IntegerParameterRange

[0-100]

vector_dim

IntegerParameterRange

[32-300]

word_ngrams

IntegerParameterRange

[1-3]