

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# BlazingText Hiperparâmetros
<a name="blazingtext_hyperparameters"></a>

Ao iniciar um trabalho de treinamento com uma solicitação `CreateTrainingJob`, você especifica um algoritmo de treinamento. Você também pode especificar hiperparâmetros específicos do algoritmo como mapas. string-to-string Os hiperparâmetros do BlazingText algoritmo dependem do modo usado: Word2Vec (não supervisionado) e Classificação de texto (supervisionado).

## Hiperparâmetros do Word2Vec
<a name="blazingtext_hyperparameters_word2vec"></a>

A tabela a seguir lista os hiperparâmetros do algoritmo de treinamento BlazingText Word2Vec fornecido pela Amazon AI. SageMaker 


| Nome do parâmetro | Description | 
| --- | --- | 
| mode |  A arquitetura do Word2vec usada para treinamento. **Obrigatório** Valores válidos: `batch_skipgram`, `skipgram` ou `cbow`  | 
| batch\$1size |  O tamanho de cada lote quando `mode` está definido como `batch_skipgram`. Defina um número de 10 a 20. **Opcional** Valores válidos: inteiro positivo Valor padrão: 11  | 
| buckets |  O número de buckets de hash a serem usados para subpalavras. **Opcional** Valores válidos: inteiro positivo Valor padrão: 2000000  | 
| epochs |  O número de passagens completas pelos dados de treinamento. **Opcional** Valores válidos: inteiro positivo Valor padrão: 5  | 
| evaluation |  Se o modelo treinado é avaliado usando o teste [WordSimilarity-353](http://www.gabrilovich.com/resources/data/wordsim353/wordsim353.html). **Opcional** Valores válidos: (booleano) `True` ou `False` Valor padrão: `True`  | 
| learning\$1rate |  O tamanho da etapa usado para atualizações de parâmetros. **Opcional** Valores válidos: flutuante positivo Valor padrão: 0.05  | 
| min\$1char |  O número mínimo de caracteres a ser usado para subpalavras/n-gramas de caracteres. **Opcional** Valores válidos: inteiro positivo Valor padrão: 3  | 
| min\$1count |  Palavras que aparecem menos de `min_count` vezes são descartadas. **Opcional** Valores válidos: inteiro não negativo Valor padrão: 5  | 
| max\$1char |  O número máximo de caracteres a serem usados para subpalavras/n-gramas de caracteres **Opcional** Valores válidos: inteiro positivo Valor padrão: 6  | 
| negative\$1samples |  O número de amostras negativas para a estratégia de compartilhamento de amostras negativas. **Opcional** Valores válidos: inteiro positivo Valor padrão: 5  | 
| sampling\$1threshold |  O limite para a ocorrência de palavras. Palavras que aparecem com maior frequência nos dados de treinamento são amostradas aleatoriamente. **Opcional** Valores válidos: fração positiva. O intervalo recomendado é (0, 1e-3] Valor padrão: 0.0001  | 
| subwords |  Se incorporações de subpalavras devem ou não ser aprendidas. **Opcional** Valores válidos: (booleano) `True` ou `False` Valor padrão: `False`  | 
| vector\$1dim |  A dimensão dos vetores de palavra que o algoritmo aprende. **Opcional** Valores válidos: inteiro positivo Valor padrão: 100  | 
| window\$1size |  O tamanho da janela de contexto. Janela de contexto é o número de palavras em torno da palavra de destino usada para treinamento. **Opcional** Valores válidos: inteiro positivo Valor padrão: 5  | 

## Hiperparâmetros de classificação de texto
<a name="blazingtext_hyperparameters_text_class"></a>

A tabela a seguir lista os hiperparâmetros do algoritmo de treinamento de classificação de texto fornecido pela Amazon SageMaker AI.

**nota**  
Embora alguns dos parâmetros sejam comuns entre os modos de Classificação de texto e Word2Vec, eles podem ter significados diferentes dependendo do contexto.


| Nome do parâmetro | Description | 
| --- | --- | 
| mode |  O modo de treinamento. **Obrigatório** Valores válidos: `supervised`  | 
| buckets |  O número de buckets de hash a serem usados para n-gramas de palavras. **Opcional** Valores válidos: inteiro positivo Valor padrão: 2000000  | 
| early\$1stopping |  Se o treinamento deve ou não ser interrompido caso a precisão de validação não melhore depois de um `patience` número de epochs. Observe que um canal de validação é obrigatório se a parada antecipada for usada. **Opcional** Valores válidos: (booleano) `True` ou `False` Valor padrão: `False`  | 
| epochs |  O número máximo de passagens completas pelos dados de treinamento. **Opcional** Valores válidos: inteiro positivo Valor padrão: 5  | 
| learning\$1rate |  O tamanho da etapa usado para atualizações de parâmetros. **Opcional** Valores válidos: flutuante positivo Valor padrão: 0.05  | 
| min\$1count |  Palavras que aparecem menos de `min_count` vezes são descartadas. **Opcional** Valores válidos: inteiro não negativo Valor padrão: 5  | 
| min\$1epochs |  O número mínimo de epochs a treinar antes que a lógica de interrupção precoce seja invocada. **Opcional** Valores válidos: inteiro positivo Valor padrão: 5  | 
| patience |  O número de epochs a aguardar antes de aplicar a interrupção precoce quando nenhum progresso é feito no conjunto de validação. Usado somente quando `early_stopping` é `True`. **Opcional** Valores válidos: inteiro positivo Valor padrão: 4  | 
| vector\$1dim |  A dimensão da camada de incorporação. **Opcional** Valores válidos: inteiro positivo Valor padrão: 100  | 
| word\$1ngrams |  O número de recursos de n-gramas de palavras a serem usados. **Opcional** Valores válidos: inteiro positivo Valor padrão: 2  | 