Hiperparámetros k-NN - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Hiperparámetros k-NN

En la siguiente tabla se enumeran los hiperparámetros que puede configurar para el algoritmo SageMaker k-NN (vecinos más cercanos) de Amazon.

Nombre del parámetro Descripción
feature_dim

El número de características en los datos de entrada.

Obligatorio

Valores válidos: número entero positivo.

k

El número de vecinos más próximos.

Obligatorio

Valores válidos: número entero positivo

predictor_type

El tipo de inferencia a usar en las etiquetas de datos.

Obligatorio

Valores válidos: clasificador para clasificación o regresor para regresión.

sample_size

El número de puntos de datos que se muestrearán a partir del conjunto de datos de capacitación.

Obligatorio

Valores válidos: número entero positivo

dimension_reduction_target

La dimensión de destino a la que reducir.

Obligatorio cuando se especifica el parámetro dimension_reduction_type.

Valores válidos: número entero positivo no superior a 0 y menor a feature_dim.

dimension_reduction_type

El tipo de método de reducción de dimensión.

Opcional

Valores válidos: señal para proyección aleatoria o fjlt para la transformación rápida de Johnson-Lindenstrauss.

Valor predeterminado: Sin reducción de dimensión

faiss_index_ivf_nlists

El número de centroides que se van a construir en el índice cuando es faiss. index_type IVFFlato falla. IVFPQ.

Opcional

Valores válidos: número entero positivo

Valor predeterminado: automático, que se resuelve como sqrt(sample_size).

faiss_index_pq_m

El número de subcomponentes vectoriales que se van a construir en el índice cuando index_type se establece en faiss. IVFPQ.

La biblioteca FaceBook AI Similarity Search (FAISS) requiere que el valor de faiss_index_pq_m sea un divisor de la dimensión de datos. Si faiss_index_pq_m no es un divisor de la dimensión de datos, se incrementará la dimensión de datos al menor el número entero divisible por faiss_index_pq_m. Si no se aplica ninguna reducción de dimensión, el algoritmo añade un relleno de ceros. Si se aplica la reducción de dimensión, el algoritmo aumenta el valor del hiperparámetro dimension_reduction_target.

Opcional

Valores válidos: uno de los siguientes números enteros positivos: 1, 2, 3, 4, 8, 12, 16, 20, 24, 28, 32, 40, 48, 56, 64, 96

index_metric

La métrica para medir la distancia entre puntos al encontrar vecinos más próximos. Cuando se capacita con index_type establecido en faiss.IVFPQ, la distancia de INNER_PRODUCT y la similitud de COSINE no son compatibles.

Opcional

Valores válidos: L2 para la distancia euclidiana, INNER_ para la distancia entre el producto interior y PRODUCT para la similitud entre cosenos. COSINE

Valor predeterminado: L2

index_type

El tipo de índice.

Opcional

Valores válidos: faiss.flat, faiss. IVFFlat, falla. IVFPQ.

Valores predeterminados: faiss.Flat

mini_batch_size

El número de observaciones por minilote para el iterador de datos.

Opcional

Valores válidos: número entero positivo

Valor predeterminado: 5000