As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
BlazingText Hiperparâmetros
Ao iniciar um trabalho de treinamento com uma solicitação CreateTrainingJob
, você especifica um algoritmo de treinamento. Você também pode especificar hiperparâmetros específicos do algoritmo como mapas. string-to-string Os hiperparâmetros do BlazingText algoritmo dependem do modo usado: Word2Vec (não supervisionado) e Classificação de texto (supervisionado).
Hiperparâmetros do Word2Vec
A tabela a seguir lista os hiperparâmetros do algoritmo de treinamento BlazingText Word2Vec fornecido pela Amazon. SageMaker
Nome do parâmetro | Descrição |
---|---|
mode |
A arquitetura do Word2vec usada para treinamento. Obrigatório Valores válidos: |
batch_size |
O tamanho de cada lote quando Opcional Valores válidos: inteiro positivo Valor padrão: 11 |
buckets |
O número de buckets de hash a serem usados para subpalavras. Opcional Valores válidos: inteiro positivo Valor padrão: 2000000 |
epochs |
O número de passagens completas pelos dados de treinamento. Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
evaluation |
Se o modelo treinado é avaliado usando o teste WordSimilarity-353 Opcional Valores válidos: (booleano) Valor padrão: |
learning_rate |
O tamanho da etapa usado para atualizações de parâmetros. Opcional Valores válidos: flutuante positivo Valor padrão: 0.05 |
min_char |
O número mínimo de caracteres a ser usado para subpalavras/n-gramas de caracteres. Opcional Valores válidos: inteiro positivo Valor padrão: 3 |
min_count |
Palavras que aparecem menos de Opcional Valores válidos: inteiro não negativo Valor padrão: 5 |
max_char |
O número máximo de caracteres a serem usados para subpalavras/n-gramas de caracteres Opcional Valores válidos: inteiro positivo Valor padrão: 6 |
negative_samples |
O número de amostras negativas para a estratégia de compartilhamento de amostras negativas. Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
sampling_threshold |
O limite para a ocorrência de palavras. Palavras que aparecem com maior frequência nos dados de treinamento são amostradas aleatoriamente. Opcional Valores válidos: fração positiva. O intervalo recomendado é (0, 1e-3] Valor padrão: 0.0001 |
subwords |
Se incorporações de subpalavras devem ou não ser aprendidas. Opcional Valores válidos: (booleano) Valor padrão: |
vector_dim |
A dimensão dos vetores de palavra que o algoritmo aprende. Opcional Valores válidos: inteiro positivo Valor padrão: 100 |
window_size |
O tamanho da janela de contexto. Janela de contexto é o número de palavras em torno da palavra de destino usada para treinamento. Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
Hiperparâmetros de classificação de texto
A tabela a seguir lista os hiperparâmetros do algoritmo de treinamento de classificação de texto fornecido pela Amazon SageMaker.
nota
Embora alguns dos parâmetros sejam comuns entre os modos de Classificação de texto e Word2Vec, eles podem ter significados diferentes dependendo do contexto.
Nome do parâmetro | Descrição |
---|---|
mode |
O modo de treinamento. Obrigatório Valores válidos: |
buckets |
O número de buckets de hash a serem usados para n-gramas de palavras. Opcional Valores válidos: inteiro positivo Valor padrão: 2000000 |
early_stopping |
Se o treinamento deve ou não ser interrompido caso a precisão de validação não melhore depois de um Opcional Valores válidos: (booleano) Valor padrão: |
epochs |
O número máximo de passagens completas pelos dados de treinamento. Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
learning_rate |
O tamanho da etapa usado para atualizações de parâmetros. Opcional Valores válidos: flutuante positivo Valor padrão: 0.05 |
min_count |
Palavras que aparecem menos de Opcional Valores válidos: inteiro não negativo Valor padrão: 5 |
min_epochs |
O número mínimo de epochs a treinar antes que a lógica de interrupção precoce seja invocada. Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
patience |
O número de epochs a aguardar antes de aplicar a interrupção precoce quando nenhum progresso é feito no conjunto de validação. Usado somente quando Opcional Valores válidos: inteiro positivo Valor padrão: 4 |
vector_dim |
A dimensão da camada de incorporação. Opcional Valores válidos: inteiro positivo Valor padrão: 100 |
word_ngrams |
O número de recursos de n-gramas de palavras a serem usados. Opcional Valores válidos: inteiro positivo Valor padrão: 2 |