Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Sequence-to-Sequence Hyperparamètres
Le tableau suivant répertorie les hyperparamètres que vous pouvez définir lors de l'entraînement avec l'algorithme Amazon SageMaker Sequence-to-Sequence (seq2seq).
Nom du paramètre | Description |
---|---|
batch_size |
Taille de lot minimale pour une pente de gradient. Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 64 |
beam_size |
Longueur du faisceau pour la recherche de faisceau. Utilisé lors de la formation pour le calcul de Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 5 |
bleu_sample_size |
Nombre d'instances à choisir dans l'ensemble de données de validation pour décoder et calculer le score de Facultatif Valeurs valides : nombre entier Valeur par défaut : 0 |
bucket_width |
Renvoie les compartiments (source, cible) jusqu'à ( Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 10 |
bucketing_enabled |
À définir sur Facultatif Valeurs valides : Valeur par défaut : |
checkpoint_frequency_num_batches |
Contrôle et évaluation tous les x lots. Cet hyperparamètre de point de contrôle est transmis à l' SageMakeralgorithme seq2seq pour arrêter rapidement et récupérer le meilleur modèle. Le point de contrôle de l'algorithme s'exécute localement dans le conteneur d'entraînement de l'algorithme et n'est pas compatible avec le point de SageMaker contrôle. L'algorithme enregistre temporairement les points de contrôle dans un chemin local et stocke l'artefact du meilleur modèle dans le chemin de sortie du modèle dans S3 après l'arrêt de la tâche d'entraînement. Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 1000 |
checkpoint_threshold |
Nombre maximal du modèle de points de contrôle autorisé à ne pas être amélioré dans Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 3 |
clip_gradient |
Rognez les valeurs de gradient absolu supérieures à celle-ci. Définissez une valeur négative pour désactiver. Facultatif Valeurs valides : float Valeur par défaut : 1 |
cnn_activation_type |
Type d'activation Facultatif Valeurs valides : string. L'une des valeurs suivantes : Valeur par défaut : |
cnn_hidden_dropout |
Probabilité de dropout entre couches convolutives. Facultatif Valeurs valides : float. Plage [0,1]. Valeur par défaut : 0 |
cnn_kernel_width_decoder |
Largeur du noyau (kernel) pour le décodeur Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 5 |
cnn_kernel_width_encoder |
Largeur du noyau (kernel) pour l'encodeur Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 3 |
cnn_num_hidden |
Nombre d'unités Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 512 |
decoder_type |
Type de décodeur. Facultatif Valeurs valides : string. Valeur par défaut : rnn |
embed_dropout_source |
Probabilité de dropout pour les intégrations côté source. Facultatif Valeurs valides : float. Plage [0,1]. Valeur par défaut : 0 |
embed_dropout_target |
Probabilité de dropout pour les intégrations côté cible. Facultatif Valeurs valides : float. Plage [0,1]. Valeur par défaut : 0 |
encoder_type |
Type d'encodeur. L'architecture des Facultatif Valeurs valides : string. Valeur par défaut : |
fixed_rate_lr_half_life |
Moitié de vie pour le taux d'apprentissage en termes de nombre de points de contrôle des planificateurs Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 10 |
learning_rate |
Taux de formation initial. Facultatif Valeurs valides : float Valeur par défaut : 0.0003 |
loss_type |
Fonction de perte pour la formation. Facultatif Valeurs valides : String. Valeur par défaut : |
lr_scheduler_type |
Type de planificateur du taux d'apprentissage. Facultatif Valeurs valides : string. Valeur par défaut : |
max_num_batches |
Nombre maximal de mises à jour/lots à traiter. -1 pour l'infini. Facultatif Valeurs valides : nombre entier Valeur par défaut : -1 |
max_num_epochs |
Nombre maximal de dates epoch à transmettre par le biais des données de formation avant que l'ajustement ne soit arrêté. La formation se poursuit jusqu'au nombre de dates epoch, même si la précision de la validation n'est pas améliorée lorsque ce paramètre est transmis. Paramètre ignoré s'il n'est pas passé. Facultatif Valeurs valides : nombre entier positif et inférieur ou égal à max_num_epochs. Valeur par défaut : none |
max_seq_len_source |
Longueur maximale de la séquence source. Les séquences qui dépassent cette longueur sont tronquées à cette valeur. Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 100 |
max_seq_len_target |
Longueur maximale de la séquence cible. Les séquences qui dépassent cette longueur sont tronquées à cette valeur. Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 100 |
min_num_epochs |
Nombre minimal de périodes (epochs) que la formation doit exécuter avant qu'elle ne soit arrêtée via les conditions Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 0 |
momentum |
Constante de vitesse utilisée pour Facultatif Valeurs valides : float Valeur par défaut : none |
num_embed_source |
Taille d'intégration des jetons source. Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 512 |
num_embed_target |
Taille d'intégration des jetons cible. Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 512 |
num_layers_decoder |
Nombre de couches du décodeur rnn ou cnn. Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 1 |
num_layers_encoder |
Nombre de couches de l'encodeur Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 1 |
optimized_metric |
Métriques d'optimisation avec arrêt anticipé. Facultatif Valeurs valides : string. Valeur par défaut : |
optimizer_type |
Optimiseur à partir duquel choisir. Facultatif Valeurs valides : string. Valeur par défaut : |
plateau_reduce_lr_factor |
Facteur avec lequel multiplier le taux d'apprentissage (pour Facultatif Valeurs valides : float Valeur par défaut : 0.5 |
plateau_reduce_lr_threshold |
Pour le planificateur Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 3 |
rnn_attention_in_upper_layers |
Portez votre attention sur les couches supérieures de rnn, comme Google NMT Paper. Applicable uniquement si plusieurs couches sont utilisées. Facultatif Valeurs valides : booléennes ( Valeur par défaut : |
rnn_attention_num_hidden |
Nombre d'unités masquées pour les couches d'attention. Valeur par défaut : Facultatif Valeurs valides : nombre entier positif Valeur par défaut : |
rnn_attention_type |
Modèle d'attention pour les encodeurs. Facultatif Valeurs valides : string. L'une des valeurs suivantes : Valeur par défaut : |
rnn_cell_type |
Type spécifique d'architecture Facultatif Valeurs valides : string. Valeur par défaut : |
rnn_decoder_state_init |
Procédure pour initialiser les états du décodeur Facultatif Valeurs valides : string. Valeur par défaut : |
rnn_first_residual_layer |
Première couche rnn à avoir une connexion résiduelle ; applicable uniquement si le nombre de couches de l'encodeur ou du décodeur est supérieur à 1. Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 2 |
rnn_num_hidden |
Nombre d'unités rnn masquées de l'encodeur et du décodeur. Cela doit être un multiple de 2 car l'algorithme utilise par défaut une mémoire bidirectionnelle à court terme à long terme (LSTM). Facultatif Valeurs valides : nombre entier positif Valeur par défaut : 1024 |
rnn_residual_connections |
Ajout d'une connexion résiduelle aux types rnn empilés. Le nombre de couches doit être supérieur à 1. Facultatif Valeurs valides : booléennes ( Valeur par défaut : |
rnn_decoder_hidden_dropout |
Probabilité de dropout d'un état masqué qui associe le contexte à l'état rnn masqué du décodeur. Facultatif Valeurs valides : float. Plage [0,1]. Valeur par défaut : 0 |
training_metric |
Métriques de suivi de la formation sur les données de validation. Facultatif Valeurs valides : string. Valeur par défaut : |
weight_decay |
Constante de dégradation de pondération. Facultatif Valeurs valides : float Valeur par défaut : 0 |
weight_init_scale |
Échelle d'initialisation de pondération (pour les initialisations Facultatif Valeurs valides : float Valeur par défaut : 2.34 |
weight_init_type |
Type d'initialisation de pondération. Facultatif Valeurs valides : string. Valeur par défaut : |
xavier_factor_type |
Type de facteur xavier. Facultatif Valeurs valides : string. Valeur par défaut : |