BlazingText ハイパーパラメータ - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

BlazingText ハイパーパラメータ

CreateTrainingJob リクエストでトレーニングジョブを開始する場合、トレーニングアルゴリズムを指定します。アルゴリズム固有のハイパーパラメータを string-to-string マップとして指定することもできます。 BlazingText アルゴリズムのハイパーパラメータは、使用するモードによって異なります。Word2Vec (教師なし) とテキスト分類 (教師あり)。

Word2Vec ハイパーパラメータ

次の表に、Amazon が提供する BlazingText Word2Vec トレーニングアルゴリズムのハイパーパラメータを示します SageMaker。

Parameter Name 説明
mode

Word2vec アーキテクチャは、トレーニングに使用されます。

必須

有効な値: batch_skipgramskipgram、または cbow

batch_size

modebatch_skipgram に設定されている場合の各バッチのサイズ。10~20 間の数字に設定します。

オプション

有効な値: 正の整数

デフォルト値: 11

buckets

サブワードに使用するハッシュバケットの数。

オプション

有効な値: 正の整数

デフォルト値: 2000000

epochs

トレーニングデータの完全なパスの数。

オプション

有効な値: 正の整数

デフォルト値: 5

evaluation

トレーニング済みモデルが WordSimilarity-353 テスト を使用して評価されているかどうかを示します。

オプション

有効な値: (ブール値) True または False

デフォルト値: True

learning_rate

パラメータ更新に使用されるステップサイズ。

オプション

有効な値: 正の浮動小数

デフォルト値: 0.05

min_char

サブワード/文字 n グラムに使用する最小文字数。

オプション

有効な値: 正の整数

デフォルト値: 3

min_count

出現回数が min_count 未満の単語は破棄されます。

オプション

有効な値: 負以外の整数

デフォルト値: 5

max_char

サブワード/文字 n グラムに使用する最大文字数。

オプション

有効な値: 正の整数

デフォルト値: 6

negative_samples

Negative Sample Sharing (負のサンプル共有) 戦略の負のサンプル数。

オプション

有効な値: 正の整数

デフォルト値: 5

sampling_threshold

単語の出現回数のしきい値。トレーニングデータ内でより高い頻度で出現する単語は、ランダムにダウンサンプリングされます。

オプション

有効な値: 正の小数。推奨される範囲は (0, 1e-3] です。

デフォルト値: 0.0001

subwords

サブワード埋め込みを学習するかどうか。

オプション

有効な値: (ブール値) True または False

デフォルト値: False

vector_dim

アルゴリズムが学習する単語ベクトルのディメンション。

オプション

有効な値: 正の整数

デフォルト値: 100

window_size

コンテキストウィンドウのサイズ。コンテキストウィンドウは、トレーニングに使用されたターゲット単語を囲む単語の数です。

オプション

有効な値: 正の整数

デフォルト値: 5

テキスト分類ハイパーパラメータ

次の表に、Amazon が提供するテキスト分類トレーニングアルゴリズムのハイパーパラメータを示します SageMaker。

注記

テキスト分類モードと Word2Vec モードのパラメータの一部は共通していますが、コンテキストによっては意味が異なる場合があります。

Parameter Name 説明
mode

トレーニングモード。

必須

有効な値: supervised

buckets

単語 n-gram に使用するハッシュバケットの数。

オプション

有効な値: 正の整数

デフォルト値: 2000000

early_stopping

エポックの patience 数を過ぎても検証の正確性が向上しない場合にトレーニングを中止するかどうか。早期停止を使用する場合は、検証チャネルが必要であることに注意してください。

オプション

有効な値: (ブール値) True または False

デフォルト値: False

epochs

トレーニングデータの完全なパスの最大数。

オプション

有効な値: 正の整数

デフォルト値: 5

learning_rate

パラメータ更新に使用されるステップサイズ。

オプション

有効な値: 正の浮動小数

デフォルト値: 0.05

min_count

出現回数が min_count 未満の単語は破棄されます。

オプション

有効な値: 負以外の整数

デフォルト値: 5

min_epochs

早期停止ロジックが呼び出される前にトレーニングするエポックの最小数。

オプション

有効な値: 正の整数

デフォルト値: 5

patience

検証セットで何も進捗がない場合に、早期停止を適用するまでに待機するエポック数。early_stoppingTrue である場合にのみ使用されます。

オプション

有効な値: 正の整数

デフォルト値: 4

vector_dim

埋め込みレイヤーのディメンション。

オプション

有効な値: 正の整数

デフォルト値: 100

word_ngrams

使用する単語 n-gram 機能の数。

オプション

有効な値: 正の整数

デフォルト値: 2