

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# BlazingText Hyperparamètres
<a name="blazingtext_hyperparameters"></a>

Lorsque vous démarrez une tâche d'entraînement avec une demande `CreateTrainingJob`, vous devez spécifier un algorithme d'entraînement. Vous pouvez également spécifier des hyperparamètres spécifiques à l'algorithme sous forme de cartes. string-to-string Les hyperparamètres de l' BlazingText algorithme dépendent du mode que vous utilisez : Word2Vec (non supervisé) et Classification de texte (supervisé).

## Hyperparamètres Word2vec
<a name="blazingtext_hyperparameters_word2vec"></a>

Le tableau suivant répertorie les hyperparamètres de l'algorithme d'entraînement BlazingText Word2Vec fourni par Amazon AI. SageMaker 


| Nom du paramètre | Description | 
| --- | --- | 
| mode | L'architecture Word2vec utilisée pour l'entraînement.<br />**Obligatoire**<br />Valeurs valides : `batch_skipgram`, `skipgram` ou `cbow` | 
| batch\_size | La taille de chaque lot lorsque `mode` est défini sur `batch_skipgram`. Définissez un nombre entre 10 et 20.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 11 | 
| buckets | Nombre de compartiments de hachage à utiliser pour les sous-mots.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 2000000 | 
| epochs | Le nombre de passages complets sur les données d'entraînements.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 5 | 
| evaluation | Si le modèle entraîné est évalué à l'aide du [test WordSimilarity -353](http://www.gabrilovich.com/resources/data/wordsim353/wordsim353.html).<br />**Facultatif**<br />Valeurs valides : (booléennes) `True` ou `False`<br />Valeur par défaut : `True` | 
| learning\_rate | Pas d'apprentissage utilisé pour les mises à jour de paramètres.<br />**Facultatif**<br />Valeurs valides : valeur flottante positive<br />Valeur par défaut : 0.05 | 
| min\_char | Nombre minimum de caractères à utiliser pour les sous-mots/n-grammes de caractère.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 3 | 
| min\_count | Les mots qui apparaissent moins de `min_count` fois sont ignorés.<br />**Facultatif**<br />Valeurs valides : entier non négatif<br />Valeur par défaut : 5 | 
| max\_char | Nombre maximum de caractères à utiliser pour les sous-mots/n-grammes de caractère.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 6 | 
| negative\_samples | Nombre d'échantillons négatifs pour la stratégie de partage d'échantillons négatifs.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 5 | 
| sampling\_threshold | Seuil de l'occurrence des mots. Les mots qui apparaissent avec une fréquence plus élevée dans les données d'entraînement sont échantillonnés de façon aléatoire.<br />**Facultatif**<br />Valeurs valides : fraction positive. Plage recommandée : [0, 1e-3].<br />Valeur par défaut : 0.0001 | 
| subwords | Indique s'il convient d'apprendre les plongements de sous-mots.<br />**Facultatif**<br />Valeurs valides : (booléennes) `True` ou `False`<br />Valeur par défaut : `False` | 
| vector\_dim | La dimension des vecteurs de mots que l'algorithme apprend.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 100 | 
| window\_size | La taille de la fenêtre de contexte. La fenêtre de contexte correspond au nombre de mots entourant le mot cible utilisé pour l'entraînement.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 5 | 

## Hyperparamètres de classification textuelle
<a name="blazingtext_hyperparameters_text_class"></a>

Le tableau suivant répertorie les hyperparamètres de l'algorithme d'entraînement à la classification de texte fourni par Amazon SageMaker AI.

**Note**  
Certains des paramètres sont communs aux modes Classification textuelle et Word2vec. Toutefois, ils peuvent avoir un sens différent selon le contexte.


| Nom du paramètre | Description | 
| --- | --- | 
| mode | Mode d'entraînement.<br />**Obligatoire**<br />Valeurs valides : `supervised` | 
| buckets | Nombre de compartiments de hachage à utiliser pour les n-grammes de mot.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 2000000 | 
| early\_stopping | Indique s'il convient d'arrêter l'entraînement si la précision de validation ne s'améliore pas après un nombre `patience` d'époques. Notez qu'un canal de validation est requis si l'arrêt anticipé est utilisé.<br />**Facultatif**<br />Valeurs valides : (booléennes) `True` ou `False`<br />Valeur par défaut : `False` | 
| epochs | Nombre maximum de passages complets sur les données d'entraînement.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 5 | 
| learning\_rate | Pas d'apprentissage utilisé pour les mises à jour de paramètres.<br />**Facultatif**<br />Valeurs valides : valeur flottante positive<br />Valeur par défaut : 0.05 | 
| min\_count | Les mots qui apparaissent moins de `min_count` fois sont ignorés.<br />**Facultatif**<br />Valeurs valides : entier non négatif<br />Valeur par défaut : 5 | 
| min\_epochs | Nombre minimum d'époques à entraîner avant d'invoquer la logique d'arrêt anticipé.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 5 | 
| patience | Nombre d'époques à attendre avant d'appliquer l'arrêt anticipé lorsqu'il n'y a aucun avancement sur l'ensemble de validation. Utilisé uniquement si `early_stopping` est `True`.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 4 | 
| vector\_dim | Dimension de la couche d'intégration.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 100 | 
| word\_ngrams | Nombre de caractéristiques de n-grammes de mot à utiliser.<br />**Facultatif**<br />Valeurs valides : nombre entier positif<br />Valeur par défaut : 2 | 