As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Hiperparâmetros de detecção de objetos
Na solicitação CreateTrainingJob
, é especificado o algoritmo de treinamento que você deseja utilizar. Você também pode definir hiperparâmetros específicos de algoritmo que são usados para ajudar a estimar os parâmetros do modelo a partir de um conjunto de dados de treinamento. A tabela a seguir lista os hiperparâmetros fornecidos pela Amazon SageMaker para treinar o algoritmo de detecção de objetos. Para obter mais informações sobre como funciona o treinamento de objetos, consulte Como funciona a detecção de objetos.
Nome do parâmetro | Descrição |
---|---|
num_classes |
O número de classes de saída. Esse parâmetro especifica as dimensões da rede de saída e geralmente é definido como o número de classes do conjunto de dados. Obrigatório Valores válidos: inteiro positivo |
num_training_samples |
O número de exemplos de treinamento no conjunto de dados de entrada. notaSe esse valor não corresponder ao número de amostras do conjunto de treinamento, o comportamento do parâmetro Obrigatório Valores válidos: inteiro positivo |
base_network |
A arquitetura de rede básica a ser usada. Opcional Valores válidos: 'vgg-16' ou 'resnet-50' Valor padrão: 'vgg-16' |
early_stopping |
Opcional Valores válidos: Valor padrão: |
early_stopping_min_epochs |
O número mínimo de epochs que devem ser executados antes que a lógica de interrupção precoce possa ser chamada. Usado apenas quando Opcional Valores válidos: inteiro positivo Valor padrão: 10 |
early_stopping_patience |
O número de epochs a aguardar antes de terminar o treinamento, se nenhuma melhoria, conforme definido pelo hiperparâmetro Opcional Valores válidos: inteiro positivo Valor padrão: 5 |
early_stopping_tolerance |
O valor de tolerância que a melhoria relativa em Opcional Valores válidos: 0 ≤ flutuante ≤ 1 Valor padrão: 0.0 |
image_shape |
O tamanho da imagem para imagens de entrada. Redimensionamos a imagem de entrada para uma imagem quadrada com esse tamanho. Convém usar 300 e 512 para um melhor desempenho. Opcional Valores válidos: número inteiro positivo ≥300 Padrão: 300 |
epochs |
O número de epochs de treinamento. Opcional Valores válidos: inteiro positivo Padrão: 30 |
freeze_layer_pattern |
A expressão regular (regex) para congelamento de camadas na rede base. Por exemplo, se definirmos Opcional Valores válidos: string Padrão: nenhuma camada congelada. |
kv_store |
O modo de sincronização de atualização de peso usado para treinamento distribuído. Os pesos podem ser atualizados de forma síncrona ou assíncrona entre as máquinas. As atualizações síncronas geralmente oferecem mais precisão do que as assíncronas, mas podem ser mais lentas. Consulte o MXNet tutorial de treinamento distribuído notaEsse parâmetro não é aplicável a treinamentos em uma máquina só. Opcional Valores válidos:
Padrão: - |
label_width |
A largura do rótulo para forçar preenchimento usado para sincronizar dados de treinamento e validação. Por exemplo, se uma imagem nos dados contiver no máximo 10 objetos e a anotação de cada objeto for especificada com 5 números, [class_id, left, top, width, height], Opcional Valores válidos: um número inteiro positivo grande o suficiente para acomodar o maior comprimento de informações de anotação nos dados. Padrão: 350 |
learning_rate |
A taxa de aprendizagem inicial. Opcional Valores válidos: flutuante em (0, 1] Padrão: 0.001 |
lr_scheduler_factor |
O índice de redução da taxa de aprendizagem. Usado em conjunto com o parâmetro Opcional Valores válidos: flutuante em (0, 1) Padrão: 0.1 |
lr_scheduler_step |
Os epochs nos quais a taxa de aprendizagem deve ser reduzida. A taxa de aprendizagem é reduzida em Opcional Valores válidos: string Padrão: string vazia |
mini_batch_size |
O tamanho do lote para treinamento. Em uma configuração de uma única máquina com várias GPUs, cada uma GPU manipula Opcional Valores válidos: inteiro positivo Padrão: 32 |
momentum |
A dinâmica de Opcional Valores válidos: flutuante em (0, 1] Padrão: 0.9 |
nms_threshold |
O limite de supressão não máximo. Opcional Valores válidos: flutuante em (0, 1] Padrão: 0.45 |
optimizer |
Os tipos de otimizador. Para obter detalhes sobre os valores do otimizador, consulteMXNet. API Opcional Valores válidos: ['sgd', 'adam', 'rmsprop', 'adadelta'] Padrão: 'sgd' |
overlap_threshold |
O limite de sobreposição de avaliação. Opcional Valores válidos: flutuante em (0, 1] Padrão: 0.5 |
use_pretrained_model |
Indica se é necessário usar um modelo pré-treinado para treinamento. Se definido como 1, o modelo pré-treinado com arquitetura correspondente é carregado e usado para treinamento. Caso contrário, a rede é treinada do zero. Opcional Valores válidos: 0 ou 1 Padrão: 1 |
weight_decay |
O coeficiente de degradação do peso para Opcional Valores válidos: flutuante em (0, 1) Padrão: 0.0005 |