翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
線形学習モデルを調整する
自動モデル調整は、ハイパーパラメータ調整とも呼ばれ、データセットのさまざまなハイパーパラメータをテストする多数のジョブを実行して、モデルの最適なバージョンを見つけます。調整可能なハイパーパラメータ、それぞれの値の範囲、および目標メトリクスを選択します。アルゴリズムが計算するメトリクスから目標メトリクスを選択します。自動モデル調整は、選択されたハイパーパラメータを検索して、目標メトリクスを最適化するモデルになる値の組み合わせを見つけます。
線形学習者アルゴリズムには、ここで説明する自動モデル調整機能とは別に、ハイパーパラメータを調整するための内部メカニズムもあります。デフォルトでは、線形学習者アルゴリズムは複数のモデルを並行してトレーニングすることによってハイパーパラメータを調整します。自動モデル調整を使用すると、線形学習者の内部調整メカニズムは自動的にオフになります。これにより、並列モデルの数 num_models
が 1 に設定されます。num_models
に設定した値は、アルゴリズムによって無視されます。
モデル調整の詳細については、「を使用した自動モデル調整 SageMaker」を参照してください。
線形学習アルゴリズムによって計算されたメトリクス
線形学習者アルゴリズムは、次のテーブルのメトリクスをレポートします。このメトリクスは、トレーニング中に計算されます。それらの 1 つを目標メトリクスとして選択してください。過剰適合を回避するために、トレーニングメトリクスではなく検証メトリクスに対してモデルを調整することをお勧めします。
メトリクス名 | 説明 | 最適化の方向 |
---|---|---|
test:absolute_loss |
テストデータセットの最終モデルの絶対損失。この目標メトリクスは、回帰にのみ有効です。 |
最小化 |
test:binary_classification_accuracy |
テストデータセットの最終モデルの精度。この目標メトリクスは、二項分類にのみ有効です。 |
最大化 |
test:binary_f_beta |
テストデータセットの最終モデルの F-ベータスコア。デフォルトでは、これは F1 スコアであり、適合率と再現率の調和平均です。この目標メトリクスは、二項分類にのみ有効です。 |
最大化 |
test:dcg |
テストデータセットの最終モデルの減損累積利得。この目標メトリクスは、複数クラス分類にのみ有効です。 |
最大化 |
test:macro_f_beta |
テストデータセットの最終モデルの F-ベータスコア。この目標メトリクスは、複数クラス分類にのみ有効です。 |
最大化 |
test:macro_precision |
テストデータセットの最終モデルの適合スコア。この目標メトリクスは、複数クラス分類にのみ有効です。 |
最大化 |
test:macro_recall |
テストデータセットの最終モデルの再現率スコア。この目標メトリクスは、複数クラス分類にのみ有効です。 |
最大化 |
test:mse |
テストデータセットの最終モデルの平均二乗誤差。この目標メトリクスは、回帰にのみ有効です。 |
最小化 |
test:multiclass_accuracy |
テストデータセットの最終モデルの精度。この目標メトリクスは、複数クラス分類にのみ有効です。 |
最大化 |
test:multiclass_top_k_accuracy |
テストデータセットで予測された上位 k のラベルの精度。このメトリクスを目標として選択する場合は、 |
最大化 |
test:objective_loss |
モデルがトレーニングされた後のテストデータセットの目標損失関数の平均値。既定の設定では、損失は、二項分類ではロジスティック損失、回帰では二乗損失です。他のタイプの損失を設定するには、 |
最小化 |
test:precision |
テストデータセットの最終モデルの適合率。このメトリクスを目標として選択した場合は、 |
最大化 |
test:recall |
テストデータセットの最終モデルの再現率。このメトリクスを目標として選択した場合は、 |
最大化 |
test:roc_auc_score |
テストデータセットにおける最終モデルの受信操作特性曲線 (ROC 曲線) の下面積。この目標メトリクスは、二項分類にのみ有効です。 |
最大化 |
validation:absolute_loss |
検証データセットの最終モデルの絶対損失。この目標メトリクスは、回帰にのみ有効です。 |
最小化 |
validation:binary_classification_accuracy |
検証データセットの最終モデルの精度。この目標メトリクスは、二項分類にのみ有効です。 |
最大化 |
validation:binary_f_beta |
検証データセットの最終モデルの F-ベータスコア。デフォルトでは、F-ベータスコアは F1 スコアであり、 |
最大化 |
validation:dcg |
検証データセットにおける最終モデルの減損累積利得。この目標メトリクスは、複数クラス分類にのみ有効です。 |
最大化 |
validation:macro_f_beta |
検証データセットの最終モデルの F-ベータスコア。この目標メトリクスは、複数クラス分類にのみ有効です。 |
最大化 |
validation:macro_precision |
検証データセットの最終モデルの適合スコア。この目標メトリクスは、複数クラス分類にのみ有効です。 |
最大化 |
validation:macro_recall |
検証データセットの最終モデルの再現率スコア。この目標メトリクスは、複数クラス分類にのみ有効です。 |
最大化 |
validation:mse |
検証データセットの最終モデルの平均二乗誤差。この目標メトリクスは、回帰にのみ有効です。 |
最小化 |
validation:multiclass_accuracy |
検証データセットの最終モデルの精度。この目標メトリクスは、複数クラス分類にのみ有効です。 |
最大化 |
validation:multiclass_top_k_accuracy |
検証データセットで予測された上位 k 個のラベルの精度。このメトリクスを目的として選択する場合は、 |
最大化 |
validation:objective_loss |
各エポックにおける検証データセットに対する目標損失関数の平均値。既定の設定では、損失は、二項分類ではロジスティック損失、回帰では二乗損失です。他のタイプの損失を設定するには、 |
最小化 |
validation:precision |
検証データセットの最終モデルの精度。このメトリクスを目標として選択した場合は、 |
最大化 |
validation:recall |
検証データセットの最終モデルのリコール。このメトリクスを目標として選択した場合は、 |
最大化 |
validation:rmse |
検証データセットの最終モデルの二乗平均平方根誤差。この目標メトリクスは、回帰にのみ有効です。 |
最小化 |
validation:roc_auc_score |
検証データセットにおける最終モデルの受信操作特性曲線 (ROC 曲線) の下面積。この目標メトリクスは、二項分類にのみ有効です。 |
最大化 |
線形学習ハイパーパラメータの調整
以下のハイパーパラメータを使用して線形学習者モデルを調整できます。
Parameter Name | パラメータタイプ | 推奨範囲 |
---|---|---|
wd |
|
|
l1 |
|
|
learning_rate |
|
|
mini_batch_size |
|
|
use_bias |
|
|
positive_example_weight_mult |
|
|