

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# BlazingText ハイパーパラメータ
<a name="blazingtext_hyperparameters"></a>

`CreateTrainingJob` リクエストでトレーニングジョブを開始する場合、トレーニングアルゴリズムを指定します。また、アルゴリズム固有のハイパーパラメータを文字列から文字列へのマップとして指定することもできます。BlazingText アルゴリズムのハイパーパラメータは、Word2Vec (教師なし) とテキスト分類 (教師あり) のどちらのモードを使用しているかによって異なります。

## Word2Vec ハイパーパラメータ
<a name="blazingtext_hyperparameters_word2vec"></a>

次の表に、Amazon SageMaker AI によって提供される BlazingText Word2Vec トレーニングアルゴリズムのハイパーパラメータを示します。


| Parameter Name | 説明 | 
| --- | --- | 
| mode |  Word2vec アーキテクチャは、トレーニングに使用されます。 **必須** 有効な値: `batch_skipgram`、`skipgram`、または `cbow`  | 
| batch\$1size |  `mode` が `batch_skipgram` に設定されている場合の各バッチのサイズ。10～20 間の数字に設定します。 **オプション** 有効な値: 正の整数 デフォルト値: 11  | 
| buckets |  サブワードに使用するハッシュバケットの数。 **オプション** 有効な値: 正の整数 デフォルト値: 2000000  | 
| epochs |  トレーニングデータの完全なパスの数。 **オプション** 有効な値: 正の整数 デフォルト値: 5  | 
| evaluation |  [WordSimilarity-353 テスト](http://www.gabrilovich.com/resources/data/wordsim353/wordsim353.html)を使用してトレーニング済みのモデルが評価されるかどうか。 **オプション** 有効な値: (ブール値) `True` または `False` デフォルト値: `True`  | 
| learning\$1rate |  パラメータ更新に使用されるステップサイズ。 **オプション** 有効な値: 正の浮動小数 デフォルト値: 0.05  | 
| min\$1char |  サブワード/文字 n グラムに使用する最小文字数。 **オプション** 有効な値: 正の整数 デフォルト値： 3  | 
| min\$1count |  出現回数が `min_count` 未満の単語は破棄されます。 **オプション** 有効な値: 負以外の整数 デフォルト値: 5  | 
| max\$1char |  サブワード/文字 n グラムに使用する最大文字数。 **オプション** 有効な値: 正の整数 デフォルト値: 6  | 
| negative\$1samples |  Negative Sample Sharing (負のサンプル共有) 戦略の負のサンプル数。 **オプション** 有効な値: 正の整数 デフォルト値: 5  | 
| sampling\$1threshold |  単語の出現回数のしきい値。トレーニングデータ内でより高い頻度で出現する単語は、ランダムにダウンサンプリングされます。 **オプション** 有効な値: 正の小数。推奨される範囲は (0, 1e-3] です。 デフォルト値: 0.0001  | 
| subwords |  サブワード埋め込みを学習するかどうか。 **オプション** 有効な値: (ブール値) `True` または `False` デフォルト値: `False`  | 
| vector\$1dim |  アルゴリズムが学習する単語ベクトルのディメンション。 **オプション** 有効な値: 正の整数 デフォルト値: 100  | 
| window\$1size |  コンテキストウィンドウのサイズ。コンテキストウィンドウは、トレーニングに使用されたターゲット単語を囲む単語の数です。 **オプション** 有効な値: 正の整数 デフォルト値: 5  | 

## テキスト分類ハイパーパラメータ
<a name="blazingtext_hyperparameters_text_class"></a>

次の表に、Amazon SageMaker AI によって提供されるテキスト分類トレーニングアルゴリズムのハイパーパラメータを示します。

**注記**  
テキスト分類モードと Word2Vec モードのパラメータの一部は共通していますが、コンテキストによっては意味が異なる場合があります。


| Parameter Name | 説明 | 
| --- | --- | 
| mode |  トレーニングモード。 **必須** 有効な値: `supervised`  | 
| buckets |  単語 n-gram に使用するハッシュバケットの数。 **オプション** 有効な値: 正の整数 デフォルト値: 2000000  | 
| early\$1stopping |  エポックの `patience` 数を過ぎても検証の正確性が向上しない場合にトレーニングを中止するかどうか。早期停止を使用する場合は、検証チャネルが必要であることに注意してください。 **オプション** 有効な値: (ブール値) `True` または `False` デフォルト値: `False`  | 
| epochs |  トレーニングデータの完全なパスの最大数。 **オプション** 有効な値: 正の整数 デフォルト値: 5  | 
| learning\$1rate |  パラメータ更新に使用されるステップサイズ。 **オプション** 有効な値: 正の浮動小数 デフォルト値: 0.05  | 
| min\$1count |  出現回数が `min_count` 未満の単語は破棄されます。 **オプション** 有効な値: 負以外の整数 デフォルト値: 5  | 
| min\$1epochs |  早期停止ロジックが呼び出される前にトレーニングするエポックの最小数。 **オプション** 有効な値: 正の整数 デフォルト値: 5  | 
| patience |  検証セットで何も進捗がない場合に、早期停止を適用するまでに待機するエポック数。`early_stopping` が `True` である場合にのみ使用されます。 **オプション** 有効な値: 正の整数 デフォルト値: 4  | 
| vector\$1dim |  埋め込みレイヤーのディメンション。 **オプション** 有効な値: 正の整数 デフォルト値: 100  | 
| word\$1ngrams |  使用する単語 n-gram 機能の数。 **オプション** 有効な値: 正の整数 デフォルト値: 2  | 