翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
BlazingText ハイパーパラメータ
CreateTrainingJob
リクエストでトレーニングジョブを開始する場合、トレーニングアルゴリズムを指定します。アルゴリズム固有のハイパーパラメータを string-to-string マップとして指定することもできます。 BlazingText アルゴリズムのハイパーパラメータは、使用するモードによって異なります。Word2Vec (教師なし) とテキスト分類 (教師あり)。
Word2Vec ハイパーパラメータ
次の表に、Amazon が提供する BlazingText Word2Vec トレーニングアルゴリズムのハイパーパラメータを示します SageMaker。
Parameter Name | 説明 |
---|---|
mode |
Word2vec アーキテクチャは、トレーニングに使用されます。 必須 有効な値: |
batch_size |
オプション 有効な値: 正の整数 デフォルト値: 11 |
buckets |
サブワードに使用するハッシュバケットの数。 オプション 有効な値: 正の整数 デフォルト値: 2000000 |
epochs |
トレーニングデータの完全なパスの数。 オプション 有効な値: 正の整数 デフォルト値: 5 |
evaluation |
トレーニング済みモデルが WordSimilarity-353 テスト オプション 有効な値: (ブール値) デフォルト値: |
learning_rate |
パラメータ更新に使用されるステップサイズ。 オプション 有効な値: 正の浮動小数 デフォルト値: 0.05 |
min_char |
サブワード/文字 n グラムに使用する最小文字数。 オプション 有効な値: 正の整数 デフォルト値: 3 |
min_count |
出現回数が オプション 有効な値: 負以外の整数 デフォルト値: 5 |
max_char |
サブワード/文字 n グラムに使用する最大文字数。 オプション 有効な値: 正の整数 デフォルト値: 6 |
negative_samples |
Negative Sample Sharing (負のサンプル共有) 戦略の負のサンプル数。 オプション 有効な値: 正の整数 デフォルト値: 5 |
sampling_threshold |
単語の出現回数のしきい値。トレーニングデータ内でより高い頻度で出現する単語は、ランダムにダウンサンプリングされます。 オプション 有効な値: 正の小数。推奨される範囲は (0, 1e-3] です。 デフォルト値: 0.0001 |
subwords |
サブワード埋め込みを学習するかどうか。 オプション 有効な値: (ブール値) デフォルト値: |
vector_dim |
アルゴリズムが学習する単語ベクトルのディメンション。 オプション 有効な値: 正の整数 デフォルト値: 100 |
window_size |
コンテキストウィンドウのサイズ。コンテキストウィンドウは、トレーニングに使用されたターゲット単語を囲む単語の数です。 オプション 有効な値: 正の整数 デフォルト値: 5 |
テキスト分類ハイパーパラメータ
次の表に、Amazon が提供するテキスト分類トレーニングアルゴリズムのハイパーパラメータを示します SageMaker。
注記
テキスト分類モードと Word2Vec モードのパラメータの一部は共通していますが、コンテキストによっては意味が異なる場合があります。
Parameter Name | 説明 |
---|---|
mode |
トレーニングモード。 必須 有効な値: |
buckets |
単語 n-gram に使用するハッシュバケットの数。 オプション 有効な値: 正の整数 デフォルト値: 2000000 |
early_stopping |
エポックの オプション 有効な値: (ブール値) デフォルト値: |
epochs |
トレーニングデータの完全なパスの最大数。 オプション 有効な値: 正の整数 デフォルト値: 5 |
learning_rate |
パラメータ更新に使用されるステップサイズ。 オプション 有効な値: 正の浮動小数 デフォルト値: 0.05 |
min_count |
出現回数が オプション 有効な値: 負以外の整数 デフォルト値: 5 |
min_epochs |
早期停止ロジックが呼び出される前にトレーニングするエポックの最小数。 オプション 有効な値: 正の整数 デフォルト値: 5 |
patience |
検証セットで何も進捗がない場合に、早期停止を適用するまでに待機するエポック数。 オプション 有効な値: 正の整数 デフォルト値: 4 |
vector_dim |
埋め込みレイヤーのディメンション。 オプション 有効な値: 正の整数 デフォルト値: 100 |
word_ngrams |
使用する単語 n-gram 機能の数。 オプション 有効な値: 正の整数 デフォルト値: 2 |