Hyperparamètres de machines de factorisation - Amazon SageMaker

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Hyperparamètres de machines de factorisation

Le tableau suivant contient les hyperparamètres pour l'algorithme Factorization Machines. Il s'agit des paramètres qui sont définis par les utilisateurs pour faciliter l'estimation des paramètres modèles issus des données. Les hyperparamètres requis qui doivent être définies sont les premiers répertoriés, dans l'ordre alphabétique. Les hyperparamètres facultatifs qui peuvent être définis sont répertoriés ensuite, également dans l'ordre alphabétique.

Nom du paramètre Description
feature_dim

Dimension de l'espace de caractéristiques d'entrée. Cela peut être très élevé avec une entrée fragmentées.

Obligatoire

Valeurs valides : nombre entier positif. Plage de valeurs suggérée : [10000,10000000]

num_factors

Dimensionnalité de factorisation.

Obligatoire

Valeurs valides : nombre entier positif. Plage de valeurs suggérée : [2,1000], 64 génère généralement de bons résultats et constitue un bon point de départ.

predictor_type

Type de prédicteur.

  • binary_classifier : pour les tâches de classification binaire.

  • regressor : pour les tâches de régression.

Obligatoire

Valeurs valides : chaîne : binary_classifier ou regressor

bias_init_method

Méthode d'initialisation pour le terme de biais :

  • normal : initialise les pondérations avec des valeurs aléatoires échantillonnées à partir d'une distribution normale avec une moyenne de 0 et un écart type spécifié par bias_init_sigma.

  • uniform : initialise les pondérations avec des valeurs aléatoires échantillonnées de manière uniforme à partir d'une plage spécifiée par [-bias_init_scale, +bias_init_scale].

  • constant : initialise les pondérations à une valeur scalaire spécifiée par bias_init_value.

Facultatif

Valeurs valides : uniform, normal ou constant

Valeur par défaut : normal

bias_init_scale

Plage pour l'initialisation du terme avec écart. Prend effet si bias_init_method est défini sur uniform.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : None (Aucune)

bias_init_sigma

Écart type pour l'initialisation du terme de biais. Prend effet si bias_init_method est défini sur normal.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : 0.01

bias_init_value

Valeur initiale du terme de biais. Prend effet si bias_init_method est défini sur constant.

Facultatif

Valeurs valides : float. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : None (Aucune)

bias_lr

Taux d'apprentissage pour le terme de biais.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : 0.1

bias_wd

Dégradation des pondérations pour le terme de biais.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : 0.01

clip_gradient

Paramètre d'optimiseur de bornement de la norme du gradient. Borne la norme du gradient par projection sur l'intervalle [-clip_gradient, +clip_gradient].

Facultatif

Valeurs valides : valeur flottante

Valeur par défaut : None (Aucune)

epochs

Nombre d'époques de formation à exécuter.

Facultatif

Valeurs valides : nombre entier positif

Valeur par défaut : 1

eps

Paramètre epsilon permettant d'éviter une division par 0.

Facultatif

Valeurs valides : float. Valeur suggérée : petite.

Valeur par défaut : None (Aucune)

factors_init_method

Méthode d'initialisation des termes de factorisation :

  • normal : initialise les pondérations avec des valeurs aléatoires échantillonnées à partir d'une distribution normale avec une moyenne de 0 et un écart type spécifié par factors_init_sigma.

  • uniform : initialise les pondérations avec des valeurs aléatoires échantillonnées de manière uniforme à partir d'une plage spécifiée par [-factors_init_scale, +factors_init_scale].

  • constant : initialise les pondérations à une valeur scalaire spécifiée par factors_init_value.

Facultatif

Valeurs valides : uniform, normal ou constant.

Valeur par défaut : normal

factors_init_scale

Plage pour l'initialisation des termes de factorisation. Prend effet si factors_init_method est défini sur uniform.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : None (Aucune)

factors_init_sigma

Écart type pour l'initialisation des termes de factorisation. Prend effet si factors_init_method est défini sur normal.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : 0.001

factors_init_value

Valeur initiale des termes de factorisation. Prend effet si factors_init_method est défini sur constant.

Facultatif

Valeurs valides : float. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : None (Aucune)

factors_lr

Taux d'apprentissage pour les termes de factorisation.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : 0.0001

factors_wd

Dégradation des pondérations pour les termes de factorisation.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : 0.00001

linear_lr

Taux d'apprentissage pour les termes linéaires.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : 0.001

linear_init_method

Méthode d'initialisation des termes linéaires :

  • normal : initialise les pondérations avec des valeurs aléatoires échantillonnées à partir d'une distribution normale avec une moyenne de 0 et un écart type spécifié par linear_init_sigma.

  • uniform : initialise les pondérations avec des valeurs aléatoires échantillonnées de manière uniforme à partir d'une plage spécifiée par [-linear_init_scale, +linear_init_scale].

  • constant : initialise les pondérations à une valeur scalaire spécifiée par linear_init_value.

Facultatif

Valeurs valides : uniform, normal ou constant.

Valeur par défaut : normal

linear_init_scale

Plage pour l'initialisation de termes linéaires. Prend effet si linear_init_method est défini sur uniform.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : None (Aucune)

linear_init_sigma

Écart type pour l'initialisation des termes linéaires. Prend effet si linear_init_method est défini sur normal.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : 0.01

linear_init_value

Valeur initiale des termes linéaires. Prend effet si linear_init_method est défini sur constant.

Facultatif

Valeurs valides : float. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : None (Aucune)

linear_wd

Dégradation des pondérations pour les termes linéaires.

Facultatif

Valeurs valides : flottante non négative. Plage de valeurs suggérée : [1e-8, 512].

Valeur par défaut : 0.001

mini_batch_size

Taille du mini-lot utilisé pour la formation.

Facultatif

Valeurs valides : nombre entier positif

Valeur par défaut : 1000

rescale_grad

Paramètre d'optimiseur de remise à l'échelle du gradient. Si cette option est définie, multiplie le dégradé avec rescale_grad avant la mise à jour. Choisissez souvent 1.0/batch_size.

Facultatif

Valeurs valides : valeur flottante

Valeur par défaut : None (Aucune)