翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Sequence to Sequence ハイパーパラメータ
次の表に、Amazon SageMaker AI Sequence-to-Sequence (seq2seq) アルゴリズムでトレーニングするときに設定できるハイパーパラメータを示します。
Parameter Name | 説明 |
---|---|
batch_size |
勾配降下のミニバッチサイズ。 オプション 有効な値: 正の整数 デフォルト値: 64 |
beam_size |
ビームサーチのビームの長さ。トレーニング中に オプション 有効な値: 正の整数 デフォルト値: 5 |
bleu_sample_size |
トレーニング中に オプション 有効な値: 整数 デフォルト値: 0 |
bucket_width |
(source,target) バケットを最大で ( オプション 有効な値: 正の整数 デフォルト値: 10 |
bucketing_enabled |
バケットを無効にし、最大長に展開するには、 オプション 有効な値: デフォルト値: |
checkpoint_frequency_num_batches |
x バッチごとにチェックポイントと評価を行います。このチェックポイントハイパーパラメータは、SageMaker AI の seq2seq アルゴリズムに渡され、最適なモデルを早期停止して取得します。アルゴリズムのチェックポイントはアルゴリズムのトレーニングコンテナでローカルに実行され、SageMaker AI チェックポイントと互換性がありません。アルゴリズムは、一時的にチェックポイントをローカルパスに保存し、トレーニングジョブが停止した後、最適なモデルアーティファクトを S3 のモデル出力パスに保存します。 オプション 有効な値: 正の整数 デフォルト値: 1000 |
checkpoint_threshold |
トレーニングが停止する前に検証データセット上の オプション 有効な値: 正の整数 デフォルト値: 3 |
clip_gradient |
これより大きなクリップのグラデーション絶対値。無効にするには、負の値に設定します。 オプション 有効な値: 浮動小数点数 デフォルト値: 1 |
cnn_activation_type |
使用される オプション 有効な値: 文字列。 デフォルト値: |
cnn_hidden_dropout |
畳み込みレイヤー間のドロップアウトのドロップアウトする確率。 オプション 有効な値: 浮動小数点数。[0,1] の範囲です。 デフォルト値: 0 |
cnn_kernel_width_decoder |
オプション 有効な値: 正の整数 デフォルト値: 5 |
cnn_kernel_width_encoder |
オプション 有効な値: 正の整数 デフォルト値: 3 |
cnn_num_hidden |
エンコーダーやデコーダーの オプション 有効な値: 正の整数 デフォルト値: 512 |
decoder_type |
デコーダーの種類。 オプション 有効な値: 文字列。 デフォルト値: rnn |
embed_dropout_source |
ソース側の埋め込みのドロップアウトする確率。 オプション 有効な値: 浮動小数点数。[0,1] の範囲です。 デフォルト値: 0 |
embed_dropout_target |
ターゲット側の埋め込みのドロップアウトする確率。 オプション 有効な値: 浮動小数点数。[0,1] の範囲です。 デフォルト値: 0 |
encoder_type |
エンコーダーの種類。 オプション 有効な値: 文字列。 デフォルト値: |
fixed_rate_lr_half_life |
オプション 有効な値: 正の整数 デフォルト値: 10 |
learning_rate |
初期学習レート。 オプション 有効な値: 浮動小数点数 デフォルト値: 0.0003 |
loss_type |
トレーニングの損失関数。 オプション 有効な値: 文字列。 デフォルト値: |
lr_scheduler_type |
学習レートスケジューラタイプ。 オプション 有効な値: 文字列。 デフォルト値: |
max_num_batches |
処理する更新/バッチの最大数。無限の場合は -1。 オプション 有効な値: 整数 デフォルト値: -1 |
max_num_epochs |
フィッティングが停止する前にトレーニングデータを移行するエポックの最大数。このパラメータが渡された場合に検証の正確性が改善しない場合でも、トレーニングはエポックがこの数に達するまで続行されます。渡されない場合は無視されます。 オプション 有効な値: max_num_epochs 以下の正の整数。 デフォルト値: なし |
max_seq_len_source |
ソースシーケンスの長さの最大長。この長さより長いシーケンスはこの長さに切り捨てられます。 オプション 有効な値: 正の整数 デフォルト値: 100 |
max_seq_len_target |
ターゲットシーケンスの長さの最大長。この長さより長いシーケンスはこの長さに切り捨てられます。 オプション 有効な値: 正の整数 デフォルト値: 100 |
min_num_epochs |
トレーニングが オプション 有効な値: 正の整数 デフォルト値: 0 |
momentum |
オプション 有効な値: 浮動小数点数 デフォルト値: なし |
num_embed_source |
ソーストークンの埋め込みサイズ。 オプション 有効な値: 正の整数 デフォルト値: 512 |
num_embed_target |
ターゲットトークンの埋め込みサイズ。 オプション 有効な値: 正の整数 デフォルト値: 512 |
num_layers_decoder |
デコーダー rnn または cnn のレイヤーの数。 オプション 有効な値: 正の整数 デフォルト値: 1 |
num_layers_encoder |
エンコーダー オプション 有効な値: 正の整数 デフォルト値: 1 |
optimized_metric |
早期停止を最適化するメトリクス。 オプション 有効な値: 文字列。 デフォルト値: |
optimizer_type |
選択するオプティマイザー。 オプション 有効な値: 文字列。 デフォルト値: |
plateau_reduce_lr_factor |
学習レートを乗算する係数 ( オプション 有効な値: 浮動小数点数 デフォルト値: 0.5 |
plateau_reduce_lr_threshold |
オプション 有効な値: 正の整数 デフォルト値: 3 |
rnn_attention_in_upper_layers |
Google NMT のペーパーのように、アテンションを rnn の上位レイヤーに渡します。複数のレイヤーが使用されている場合にのみ適用できます。 オプション 有効な値: ブール値 ( デフォルト値: |
rnn_attention_num_hidden |
アテンションレイヤーの非表示ユニットの数。デフォルトは オプション 有効な値: 正の整数 デフォルト値: |
rnn_attention_type |
エンコーダーのアテンションモデル。Luong らのペーパーによると、 オプション 有効な値: 文字列。 デフォルト値: |
rnn_cell_type |
特定のタイプの オプション 有効な値: 文字列。 デフォルト値: |
rnn_decoder_state_init |
オプション 有効な値: 文字列。 デフォルト値: |
rnn_first_residual_layer |
残差接続がある最初の rnn レイヤー、エンコーダーまたはデコーダー内のレイヤーの数が 1 を超える場合にのみ適用可能。 オプション 有効な値: 正の整数 デフォルト値: 2 |
rnn_num_hidden |
エンコーダーおよびデコーダーの rnn の非表示ユニットの数。このアルゴリズムはデフォルトで双方向の長短期記憶 (LSTM) を使用するため、これは 2 の倍数である必要があります。 オプション 有効な値: 正の偶数 デフォルト値: 1024 |
rnn_residual_connections |
多層 rnn に残差接続を追加する。レイヤーの数は 1 を超える必要があります。 オプション 有効な値: ブール値 ( デフォルト値: |
rnn_decoder_hidden_dropout |
コンテキストをデコーダーの rnn の非表示状態を組み合わせる、非表示状態のドロップアウトする確率。 オプション 有効な値: 浮動小数点数。[0,1] の範囲です。 デフォルト値: 0 |
training_metric |
検証データ上のトレーニングを追跡するメトリクス。 オプション 有効な値: 文字列。 デフォルト値: |
weight_decay |
重み減衰定数。 オプション 有効な値: 浮動小数点数 デフォルト値: 0 |
weight_init_scale |
重み初期化方法のスケール (初期化方法が オプション 有効な値: 浮動小数点数 デフォルト値: 2.34 |
weight_init_type |
重み初期化方法の種類。 オプション 有効な値: 文字列。 デフォルト値: |
xavier_factor_type |
Xavier の係数タイプ。 オプション 有効な値: 文字列。 デフォルト値: |