As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Ajustar um BlazingText modelo
O ajuste automático de modelos, também conhecido como ajuste de hiperparâmetros, localiza a melhor versão de um modelo executando vários trabalhos que testam uma série de hiperparâmetros no seu conjunto de dados. Você escolhe os hiperparâmetros ajustáveis, um intervalo de valores para cada um e uma métrica objetiva. Você escolhe a métrica objetiva entre as métricas que o algoritmo calcula. O ajuste de modelo automático pesquisa os hiperparâmetros escolhidos para encontrar a combinação de valores que resultam no modelo que otimiza a métrica objetiva.
Para mais informações sobre o ajuste de modelos, consulte Ajuste automático do modelo com SageMaker IA.
Métricas calculadas pelo algoritmo BlazingText
O algoritmo BlazingText Word2Vec (skipgram
,cbow
, e batch_skipgram
modos) relata uma única métrica durante o treinamento:. train:mean_rho
Esta métrica é calculada em conjuntos de dados de semelhança de palavras WS-353
O algoritmo de Classificação de BlazingText Texto (supervised
modo) também relata uma única métrica durante o treinamento: validation:accuracy
a. Ao ajustar os valores de hiperparâmetros para o algoritmo de classificação de texto, use estas métricas como o objetivo.
Nome da métrica | Descrição | Direção de otimização |
---|---|---|
train:mean_rho |
O rho (coeficiente de correlação de classificação de Spearman) médio em conjuntos de dados de semelhança de palavras WS-353 |
Maximizar |
validation:accuracy |
A precisão da classificação no conjunto de dados de validação especificado pelo usuário |
Maximizar |
Hiperparâmetros ajustáveis BlazingText
Hyperparameters ajustáveis para o algoritmo Word2Vec
Ajuste um modelo Amazon SageMaker AI BlazingText Word2Vec com os seguintes hiperparâmetros. Os hiperparâmetros que têm o maior impacto nas métricas objetivas de Word2Vec são: mode
, learning_rate
, window_size
, vector_dim
e negative_samples
.
Nome do parâmetro | Tipo de parâmetro | Intervalos ou valores recomendados |
---|---|---|
batch_size |
|
[8-32] |
epochs |
|
[5-15] |
learning_rate |
|
MinValue: 0,005, MaxValue: 0,01 |
min_count |
|
[0-100] |
mode |
|
[ |
negative_samples |
|
[5-25] |
sampling_threshold |
|
MinValue: 0,0001, MaxValue: 0,001 |
vector_dim |
|
[32-300] |
window_size |
|
[1-10] |
Hiperparâmetros ajustáveis para o algoritmo de classificação de texto
Ajuste um modelo de classificação BlazingText de texto da Amazon SageMaker AI com os seguintes hiperparâmetros.
Nome do parâmetro | Tipo de parâmetro | Intervalos ou valores recomendados |
---|---|---|
buckets |
|
[1000000-10000000] |
epochs |
|
[5-15] |
learning_rate |
|
MinValue: 0,005, MaxValue: 0,01 |
min_count |
|
[0-100] |
vector_dim |
|
[32-300] |
word_ngrams |
|
[1-3] |