As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Ao iniciar um trabalho de treinamento com uma solicitação CreateTrainingJob
, você especifica um algoritmo de treinamento. Você também pode especificar hiperparâmetros específicos do algoritmo como mapas. string-to-string Os hiperparâmetros do BlazingText algoritmo dependem do modo usado: Word2Vec (não supervisionado) e Classificação de texto (supervisionado).
Hiperparâmetros do Word2Vec
A tabela a seguir lista os hiperparâmetros do algoritmo de treinamento BlazingText Word2Vec fornecido pela Amazon AI. SageMaker
Nome do parâmetro | Descrição |
---|---|
mode |
A arquitetura do Word2vec usada para treinamento. Obrigatório Valores válidos: |
batch_size |
O tamanho de cada lote quando Opcional Valores válidos: inteiro positivo Valor padrão: 11 |
buckets |
O número de buckets de hash a serem usados para subpalavras. Opcional Valores válidos: inteiro positivo Valor padrão: 2000000 |
epochs |
O número de passagens completas pelos dados de treinamento. Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
evaluation |
Se o modelo treinado é avaliado usando o teste WordSimilarity-353 Opcional Valores válidos: (booleano) Valor padrão: |
learning_rate |
O tamanho da etapa usado para atualizações de parâmetros. Opcional Valores válidos: flutuante positivo Valor padrão: 0.05 |
min_char |
O número mínimo de caracteres a ser usado para subpalavras/n-gramas de caracteres. Opcional Valores válidos: inteiro positivo Valor padrão: 3 |
min_count |
Palavras que aparecem menos de Opcional Valores válidos: inteiro não negativo Valor padrão: 5 |
max_char |
O número máximo de caracteres a serem usados para subpalavras/n-gramas de caracteres Opcional Valores válidos: inteiro positivo Valor padrão: 6 |
negative_samples |
O número de amostras negativas para a estratégia de compartilhamento de amostras negativas. Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
sampling_threshold |
O limite para a ocorrência de palavras. Palavras que aparecem com maior frequência nos dados de treinamento são amostradas aleatoriamente. Opcional Valores válidos: fração positiva. O intervalo recomendado é (0, 1e-3] Valor padrão: 0.0001 |
subwords |
Se incorporações de subpalavras devem ou não ser aprendidas. Opcional Valores válidos: (booleano) Valor padrão: |
vector_dim |
A dimensão dos vetores de palavra que o algoritmo aprende. Opcional Valores válidos: inteiro positivo Valor padrão: 100 |
window_size |
O tamanho da janela de contexto. Janela de contexto é o número de palavras em torno da palavra de destino usada para treinamento. Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
Hiperparâmetros de classificação de texto
A tabela a seguir lista os hiperparâmetros do algoritmo de treinamento de classificação de texto fornecido pela Amazon SageMaker AI.
nota
Embora alguns dos parâmetros sejam comuns entre os modos de Classificação de texto e Word2Vec, eles podem ter significados diferentes dependendo do contexto.
Nome do parâmetro | Descrição |
---|---|
mode |
O modo de treinamento. Obrigatório Valores válidos: |
buckets |
O número de buckets de hash a serem usados para n-gramas de palavras. Opcional Valores válidos: inteiro positivo Valor padrão: 2000000 |
early_stopping |
Se o treinamento deve ou não ser interrompido caso a precisão de validação não melhore depois de um Opcional Valores válidos: (booleano) Valor padrão: |
epochs |
O número máximo de passagens completas pelos dados de treinamento. Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
learning_rate |
O tamanho da etapa usado para atualizações de parâmetros. Opcional Valores válidos: flutuante positivo Valor padrão: 0.05 |
min_count |
Palavras que aparecem menos de Opcional Valores válidos: inteiro não negativo Valor padrão: 5 |
min_epochs |
O número mínimo de epochs a treinar antes que a lógica de interrupção precoce seja invocada. Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
patience |
O número de epochs a aguardar antes de aplicar a interrupção precoce quando nenhum progresso é feito no conjunto de validação. Usado somente quando Opcional Valores válidos: inteiro positivo Valor padrão: 4 |
vector_dim |
A dimensão da camada de incorporação. Opcional Valores válidos: inteiro positivo Valor padrão: 100 |
word_ngrams |
O número de recursos de n-gramas de palavras a serem usados. Opcional Valores válidos: inteiro positivo Valor padrão: 2 |