Hiperparámetros de Image Classification - TensorFlow - Amazon SageMaker

Hiperparámetros de Image Classification - TensorFlow

Los hiperparámetros son parámetros que se establecen antes de que un modelo de machine learning comience a aprender. Los siguientes hiperparámetros son compatibles con el algoritmo integrado Image Classification - TensorFlow de Amazon SageMaker. Para obtener más información sobre el ajuste de hiperparámetros, consulte Ajuste de un modelo de Image Classification - TensorFlow.

Nombre del parámetro Descripción
augmentation

Configure "True" para aplicar augmentation_random_flip, augmentation_random_rotation y augmentation_random_zoom en los datos de entrenamiento.

Valores válidos: cadena ("True" o "False").

Valor predeterminado: "False".

augmentation_random_flip

Indica qué modo de volteo se debe utilizar para el aumento de datos cuando augmentation está configurado en "True". Para obtener más información, consulte RandomFlip en la documentación de TensorFlow.

Valores válidos: cadena ("horizontal_and_vertical", "vertical" o "None").

Valor predeterminado: "horizontal_and_vertical".

augmentation_random_rotation

Indica el grado de rotación que se debe utilizar para el aumento de datos cuando augmentation está establecido en "True". Los valores representan una fracción de 2π. Los valores positivos giran en sentido contrario a las agujas del reloj, mientras que los valores negativos giran en sentido horario. 0 significa que no hay rotación. Para obtener más información, consulte RandomRotation en la documentación de TensorFlow.

Valores válidos: flotante, con el rango [-1.0, 1.0].

Valor predeterminado: 0.2.

augmentation_random_zoom

Indica el grado de zoom vertical que se debe utilizar para el aumento de datos cuando augmentation está establecido en "True". Los valores positivos se alejan, mientras que los valores negativos se acercan. 0 significa que no hay zoom. Para obtener más información, consulte RandomZoom en la documentación de TensorFlow.

Valores válidos: flotante, con el rango [-1.0, 1.0].

Valor predeterminado: 0.1.

batch_size

El tamaño del lote para la capacitación. Para el entrenamiento en instancias con varias GPU, este tamaño de lote se utiliza en todas las GPU.

Valores válidos: número entero positivo.

Valor predeterminado: 32.

beta_1

La versión beta1 del optimizador "adam". Representa la tasa de degradación exponencial para las estimaciones del primer momento. No se tiene en cuenta para otros optimizadores.

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: 0.9.

beta_2

La versión beta2 del optimizador "adam". Representa la tasa de degradación exponencial para las estimaciones del segundo momento. No se tiene en cuenta para otros optimizadores.

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: 0.999.

binary_mode

Cuando binary_mode se establece en "True", el modelo devuelve un único número de probabilidad para la clase positiva y puede utilizar opciones eval_metric adicionales. Úselo solo para problemas de clasificación binaria.

Valores válidos: cadena ("True" o "False").

Valor predeterminado: "False".

dropout_rate

La tasa de eliminación en la capa de eliminación, dentro de la capa de clasificación superior.

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: 0.2

early_stopping

Se establece en "True" a fin de usar una lógica de detención temprana durante el entrenamiento. Si es "False", no se utiliza la interrupción temprana.

Valores válidos: cadena ("True" o "False").

Valor predeterminado: "False".

early_stopping_min_delta El cambio mínimo necesario para considerarse una mejora. Un cambio absoluto inferior al valor de early_stopping_min_delta no se considera mejora. Solo se usa cuando early_stopping está establecido en "True".

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: 0.0.

early_stopping_patience

El número de epochs (fechas de inicio) para seguir entrenando sin que haya mejoras. Solo se usa cuando early_stopping está establecido en "True".

Valores válidos: número entero positivo.

Valor predeterminado: 5.

epochs

El número de fechas de inicio de capacitación.

Valores válidos: número entero positivo.

Valor predeterminado: 3.

epsilon

El valor épsilon para los optimizadores "adam", "rmsprop", "adadelta" y "adagrad". Se suele establecer en un valor pequeño para evitar la división por 0. No se tiene en cuenta para otros optimizadores.

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: 1e-7.

eval_metric

Si binary_mode se establece en "False", eval_metric solo puede ser "accuracy". Si binary_mode es "True", seleccione cualquiera de los valores válidos. Para obtener más información, consulte Metrics en la documentación de TensorFlow.

Valores válidos: cadena ("accuracy", "precision", "recall", "auc" o "prc").

Valor predeterminado: "accuracy".

image_resize_interpolation

Indica el método de interpolación utilizado al cambiar el tamaño de las imágenes. Para obtener más información, consulte image.resize en la documentación de TensorFlow.

Valores válidos: cadena ("bilinear", "nearest", "bicubic", "area", "lanczos3", "lanczos5", "gaussian" o "mitchellcubic").

Valor predeterminado: "bilinear".

initial_accumulator_value

El valor inicial de los acumuladores o los valores de impulso por parámetro del optimizador "adagrad". No se tiene en cuenta para otros optimizadores.

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: 0.0001.

label_smoothing

Indica en qué medida se debe relajar la confianza en los valores de las etiquetas. Por ejemplo, si label_smoothing es 0.1, las etiquetas que no son de destino serán 0.1/num_classes y las etiquetas de destino serán 0.9+0.1/num_classes.

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: 0.1.

learning_rate La tasa de aprendizaje del optimizador.

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: 0.001.

momentum

El impulso para los optimizadores "sgd", "nesterov" y "rmsprop". No se tiene en cuenta para otros optimizadores.

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: 0.9.

optimizer

El tipo de optimizador. Para obtener más información, consulte Optimizers en la documentación de TensorFlow.

Valores válidos: cadena, ("adam", "sgd", "nesterov", "rmsprop", "adagrad" o "adadelta").

Valor predeterminado: "adam".

regularizers_l2

El factor de regularización L2 de la capa densa en la capa de clasificación.

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: .0001.

reinitialize_top_layer

Si se establece en "Auto", los parámetros de la capa de clasificación superior se reinicializan durante el ajuste. Para el entrenamiento incremental, los parámetros de la capa de clasificación superior no se reinicializan, a no ser que se establezca en "True".

Valores válidos: cadena, "Auto", "True" o "False".

Valor predeterminado: "Auto".

rho

El factor de descuento para el gradiente de los optimizadores "adadelta" y "rmsprop". No se tiene en cuenta para otros optimizadores.

Valores válidos: flotante, con el rango [0.0, 1.0].

Valor predeterminado: 0.95.

train_only_top_layer

Si es "True", solo se ajustan los parámetros de la capa de clasificación superior. Si es "False", todos los parámetros del modelo se ajustan.

Valores válidos: cadena ("True" o "False").

Valor predeterminado: "False".