Hiperparámetros k-NN - Amazon SageMaker

Hiperparámetros k-NN

En la siguiente tabla se muestran los hiperparámetros que puede configurar para el algoritmo de k vecinos más cercanos (k-NN) de Amazon SageMaker.

Nombre del parámetro Descripción
feature_dim

El número de características en los datos de entrada.

Obligatorio

Valores válidos: número entero positivo.

k

El número de vecinos más próximos.

Obligatorio

Valores válidos: número entero positivo

predictor_type

El tipo de inferencia a usar en las etiquetas de datos.

Obligatorio

Valores válidos: clasificador para clasificación o regresor para regresión.

sample_size

El número de puntos de datos que se muestrearán a partir del conjunto de datos de capacitación.

Obligatorio

Valores válidos: número entero positivo

dimension_reduction_target

La dimensión de destino a la que reducir.

Obligatorio cuando se especifica el parámetro dimension_reduction_type.

Valores válidos: número entero positivo no superior a 0 y menor a feature_dim.

dimension_reduction_type

El tipo de método de reducción de dimensión.

Opcional

Valores válidos: señal para proyección aleatoria o fjlt para la transformación rápida de Johnson-Lindenstrauss.

Valor predeterminado: Sin reducción de dimensión

faiss_index_ivf_nlists

El número de centroides a construir en el índice cuando index_type es faiss.IVFFlat o faiss.IVFPQ.

Opcional

Valores válidos: número entero positivo

Valor predeterminado: automático, que se resuelve como sqrt(sample_size).

faiss_index_pq_m

El número de subcomponentes vectoriales a construir en el índice cuando index_type se fija en faiss.IVFPQ.

La biblioteca FaceBook AI Similarity Search (FAISS) requiere que el valor de faiss_index_pq_m sea un divisor de la dimensión de datos. Si faiss_index_pq_m no es un divisor de la dimensión de datos, se incrementará la dimensión de datos al menor el número entero divisible por faiss_index_pq_m. Si no se aplica ninguna reducción de dimensión, el algoritmo añade un relleno de ceros. Si se aplica la reducción de dimensión, el algoritmo aumenta el valor del hiperparámetro dimension_reduction_target.

Opcional

Valores válidos: uno de los siguientes números enteros positivos: 1, 2, 3, 4, 8, 12, 16, 20, 24, 28, 32, 40, 48, 56, 64, 96

index_metric

La métrica para medir la distancia entre puntos al encontrar vecinos más próximos. Cuando se capacita con index_type establecido en faiss.IVFPQ, la distancia de INNER_PRODUCT y la similitud de COSINE no son compatibles.

Opcional

Valores válidos: L2 para distancia euclidiana, INNER_PRODUCT para distancia de producto interior, COSINE para similitud de coseno.

Valor predeterminado: L2

index_type

El tipo de índice.

Opcional

Valores válidos: faiss.Flat, faiss.IVFFlat, faiss.IVFPQ.

Valores predeterminados: faiss.Flat

mini_batch_size

El número de observaciones por minilote para el iterador de datos.

Opcional

Valores válidos: número entero positivo

Valor predeterminado: 5000