Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Ajuste un modelo BlazingText
El ajuste de modelo automático, también conocido como ajuste de hiperparámetros, encuentra la mejor versión de un modelo ejecutando muchas tareas que probar una serie de hiperparámetros en su conjunto de datos. Usted elige los hiperparámetros que pueden ajustarse, un rango de valores para cada uno de ellos y una métrica objetiva. Puede elegir la métrica objetiva de las métricas que el algoritmo computa. El ajuste de modelo automático busca los hiperparámetros elegidos para encontrar la combinación de valores que obtienen el modelo que optimiza la métrica objetiva.
Para obtener más información acerca del ajuste de modelos, consulte Ajuste automático del modelo con SageMaker.
Métricas calculadas por el algoritmo BlazingText
El algoritmo BlazingText Word2Vec (skipgram
cbow
, y los batch_skipgram
modos) informa sobre una sola métrica durante el entrenamiento:. train:mean_rho
Esta métrica se computa en conjuntos de datos de WS-353 de similitud de palabras
El algoritmo de clasificación de BlazingText textos (supervised
modo) también informa sobre una única métrica durante el entrenamiento: la. validation:accuracy
Al ajustar los valores del hiperparámetro para el algoritmo de clasificación de texto, utilice estas métricas como la métrica objetiva.
Nombre de métrica | Descripción | Dirección de optimización |
---|---|---|
train:mean_rho |
La ro media (coeficiente de correlación de clasificación de Spearman) en conjuntos de datos de WS-353 de similitud de palabras |
Maximizar |
validation:accuracy |
La precisión de clasificación en el conjunto de datos de validación especificado por el usuario |
Maximizar |
Hiperparámetros ajustables BlazingText
Hiperparámetros ajustables para el algoritmo Word2Vec
Ajuste un modelo de Amazon SageMaker BlazingText Word2Vec con los siguientes hiperparámetros. Los hiperparámetros con el mayor impacto en métricas objetivas de Word2Vec son: mode
, learning_rate
, window_size
, vector_dim
y negative_samples
.
Nombre del parámetro | Tipo de parámetro | Rangos o valores recomendados |
---|---|---|
batch_size |
|
[8-32] |
epochs |
|
[5-15] |
learning_rate |
|
MinValue: 0,005,: 0,01 MaxValue |
min_count |
|
[0-100] |
mode |
|
[ |
negative_samples |
|
[5-25] |
sampling_threshold |
|
MinValue: 0,0001, MaxValue 0,001 |
vector_dim |
|
[32-300] |
window_size |
|
[1-10] |
Hiperparámetros ajustables para el algoritmo de clasificación de texto
Ajuste un modelo de clasificación de SageMaker BlazingText textos de Amazon con los siguientes hiperparámetros.
Nombre del parámetro | Tipo de parámetro | Rangos o valores recomendados |
---|---|---|
buckets |
|
[1000000-10000000] |
epochs |
|
[5-15] |
learning_rate |
|
MinValue: 0,005, MaxValue: 0,01 |
min_count |
|
[0-100] |
vector_dim |
|
[32-300] |
word_ngrams |
|
[1-3] |