線形学習モデルを調整する - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

線形学習モデルを調整する

自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、データセットのさまざまなハイパーパラメータをテストする多数のジョブを実行して、モデルの最適なバージョンを見つけます。調整可能なハイパーパラメータ、それぞれの値の範囲、および目標メトリクスを選択します。アルゴリズムが計算するメトリクスから目標メトリクスを選択します。自動モデル調整は、選択されたハイパーパラメータを検索して、目標メトリクスを最適化するモデルになる値の組み合わせを見つけます。

線形学習者アルゴリズムには、ここで説明する自動モデル調整機能とは別に、ハイパーパラメータを調整するための内部メカニズムもあります。デフォルトでは、線形学習者アルゴリズムは複数のモデルを並行してトレーニングすることによってハイパーパラメータを調整します。自動モデル調整を使用すると、線形学習者の内部調整メカニズムは自動的にオフになります。これにより、並列モデルの数 num_models が 1 に設定されます。num_models に設定した値は、アルゴリズムによって無視されます。

モデル調整の詳細については、「を使用した自動モデル調整 SageMaker」を参照してください。

線形学習アルゴリズムによって計算されたメトリクス

線形学習者アルゴリズムは、次のテーブルのメトリクスをレポートします。このメトリクスは、トレーニング中に計算されます。それらの 1 つを目標メトリクスとして選択してください。過剰適合を回避するために、トレーニングメトリクスではなく検証メトリクスに対してモデルを調整することをお勧めします。

メトリクス名 説明 最適化の方向
test:absolute_loss

テストデータセットの最終モデルの絶対損失。この目標メトリクスは、回帰にのみ有効です。

最小化

test:binary_classification_accuracy

テストデータセットの最終モデルの精度。この目標メトリクスは、二項分類にのみ有効です。

最大化

test:binary_f_beta

テストデータセットの最終モデルの F-ベータスコア。デフォルトでは、これは F1 スコアであり、適合率と再現率の調和平均です。この目標メトリクスは、二項分類にのみ有効です。

最大化

test:dcg

テストデータセットの最終モデルの減損累積利得。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

test:macro_f_beta

テストデータセットの最終モデルの F-ベータスコア。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

test:macro_precision

テストデータセットの最終モデルの適合スコア。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

test:macro_recall

テストデータセットの最終モデルの再現率スコア。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

test:mse

テストデータセットの最終モデルの平均二乗誤差。この目標メトリクスは、回帰にのみ有効です。

最小化

test:multiclass_accuracy

テストデータセットの最終モデルの精度。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

test:multiclass_top_k_accuracy

テストデータセットで予測された上位 k のラベルの精度。このメトリクスを目標として選択する場合は、accuracy_top_k ハイパーパラメータを使用して k の値を設定することをおすすめします。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

test:objective_loss

モデルがトレーニングされた後のテストデータセットの目標損失関数の平均値。既定の設定では、損失は、二項分類ではロジスティック損失、回帰では二乗損失です。他のタイプの損失を設定するには、 loss ハイパーパラメータを使用します。

最小化

test:precision

テストデータセットの最終モデルの適合率。このメトリクスを目標として選択した場合は、binary_classifier_model_selection ハイパーパラメータを precision_at_target_recall に設定し、target_recall ハイパーパラメータの値を設定して、目標再現率を設定することをお勧めします。この目標メトリクスは、二項分類にのみ有効です。

最大化

test:recall

テストデータセットの最終モデルの再現率。このメトリクスを目標として選択した場合は、binary_classifier_model_selection ハイパーパラメータを recall_at_target_precision に設定し、target_precision ハイパーパラメータの値を設定して、目標適合率を設定することをお勧めします。この目標メトリクスは、二項分類にのみ有効です。

最大化

test:roc_auc_score

テストデータセットにおける最終モデルの受信操作特性曲線 (ROC 曲線) の下面積。この目標メトリクスは、二項分類にのみ有効です。

最大化

validation:absolute_loss

検証データセットの最終モデルの絶対損失。この目標メトリクスは、回帰にのみ有効です。

最小化

validation:binary_classification_accuracy

検証データセットの最終モデルの精度。この目標メトリクスは、二項分類にのみ有効です。

最大化

validation:binary_f_beta

検証データセットの最終モデルの F-ベータスコア。デフォルトでは、F-ベータスコアは F1 スコアであり、validation:precision および validation:recall メトリクスの調和平均です。この目標メトリクスは、二項分類にのみ有効です。

最大化

validation:dcg

検証データセットにおける最終モデルの減損累積利得。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

validation:macro_f_beta

検証データセットの最終モデルの F-ベータスコア。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

validation:macro_precision

検証データセットの最終モデルの適合スコア。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

validation:macro_recall

検証データセットの最終モデルの再現率スコア。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

validation:mse

検証データセットの最終モデルの平均二乗誤差。この目標メトリクスは、回帰にのみ有効です。

最小化

validation:multiclass_accuracy

検証データセットの最終モデルの精度。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

validation:multiclass_top_k_accuracy

検証データセットで予測された上位 k 個のラベルの精度。このメトリクスを目的として選択する場合は、accuracy_top_k ハイパーパラメータを使用して k の値を設定することをおすすめします。この目標メトリクスは、複数クラス分類にのみ有効です。

最大化

validation:objective_loss

各エポックにおける検証データセットに対する目標損失関数の平均値。既定の設定では、損失は、二項分類ではロジスティック損失、回帰では二乗損失です。他のタイプの損失を設定するには、loss ハイパーパラメータを使用します。

最小化

validation:precision

検証データセットの最終モデルの精度。このメトリクスを目標として選択した場合は、binary_classifier_model_selection ハイパーパラメータを precision_at_target_recall に設定し、target_recall ハイパーパラメータの値を設定して、目標再現率を設定することをお勧めします。この目標メトリクスは、二項分類にのみ有効です。

最大化

validation:recall

検証データセットの最終モデルのリコール。このメトリクスを目標として選択した場合は、binary_classifier_model_selection ハイパーパラメータを recall_at_target_precision に設定し、target_precision ハイパーパラメータの値を設定して、目標適合率を設定することをお勧めします。この目標メトリクスは、二項分類にのみ有効です。

最大化

validation:rmse

検証データセットの最終モデルの二乗平均平方根誤差。この目標メトリクスは、回帰にのみ有効です。

最小化

validation:roc_auc_score

検証データセットにおける最終モデルの受信操作特性曲線 (ROC 曲線) の下面積。この目標メトリクスは、二項分類にのみ有効です。

最大化

線形学習ハイパーパラメータの調整

以下のハイパーパラメータを使用して線形学習者モデルを調整できます。

Parameter Name パラメータタイプ 推奨範囲
wd

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

l1

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

learning_rate

ContinuousParameterRanges

MinValue: 1e-5, MaxValue: 1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue: 5000

use_bias

CategoricalParameterRanges

[True, False]

positive_example_weight_mult

ContinuousParameterRanges

MinValue: 1e-5、MaxValue: 1e5