Hiperparâmetros do RCF - Amazon SageMaker

Hiperparâmetros do RCF

Na solicitação CreateTrainingJob, é especificado o algoritmo de treinamento. Também é possível especificar hiperparâmetros específicos de algoritmo como mapas de string a string. A tabela a seguir lista os hiperparâmetros do algoritmo RCF do Amazon SageMaker. Para obter mais informações, incluindo recomendações sobre como escolher hiperparâmetros, consulte Como o RCF funciona.

Nome do parâmetro Descrição
feature_dim

O número de atributos no conjunto de dados. (Se você usar o estimador de Random Cut Forest, esse valor será calculado para você e não precisará ser especificado.)

Obrigatório

Valores válidos: inteiro positivo (mínimo: 1; máximo: 10000)

eval_metrics

Uma lista de métricas usadas para pontuar um conjunto de dados de teste rotulado. As métricas a seguir podem ser selecionadas para o resultado:

  • accuracy: retorna a fração de predições corretas.

  • precision_recall_fscore: retorna as exatidões positiva e negativa, o recall e as pontuações F1.

Opcional

Valores válidos: uma lista com valores possíveis extraídos de accuracy ou precision_recall_fscore.

Valor padrão: accuracy e precision_recall_fscore são calculados.

num_samples_per_tree

Número de amostras aleatórias atribuídos a cada árvore do conjunto de dados de treinamento.

Opcional

Valores válidos: inteiro positivo (mínimo: 1; máximo: 2048)

Valor padrão: 256

num_trees

Número de árvores na floresta.

Opcional

Valores válidos: inteiro positivo (mínimo: 50; máximo: 1000)

Valor padrão: 100