翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
IP Insights モデルを調整する
ハイパーパラメータ調整とも呼ばれるモデル自動調整は、モデルの最適なバージョンを見つけるために、データセットに対してさまざまなハイパーパラメータをテストする多数のジョブを実行します。調整可能なハイパーパラメータ、それぞれの値の範囲、および目標メトリクスを選択します。アルゴリズムが計算するメトリクスから目標メトリクスを選択します。自動モデル調整は、選択されたハイパーパラメータを検索して、目標メトリクスを最適化するモデルになる値の組み合わせを見つけます。
モデル調整の詳細については、「を使用した自動モデル調整 SageMaker」を参照してください。
IP Insights アルゴリズムによって計算されたメトリクス
Amazon SageMaker IP Insights アルゴリズムは、IP アドレスとエンティティ間の関連を学習する教師なしの学習アルゴリズムです。このアルゴリズムは、観測されたデータポイント (正のサンプル) をランダムに生成されたデータポイント (負のサンプル) と区別することを学習する識別子モデルをトレーニングします。IP Insights の自動モデル調整は、ラベルなしの検証データと自動的に生成された負のサンプルを最も正確に区別できるモデルを見つけるのに役立ちます。検証データセットのモデル精度は、受信者動作特性曲線下面積によって測定されます。この validation:discriminator_auc
メトリクスは、0.0 ~ 1.0 の値をとることができます。ここで、1.0 は完全な精度を示します。
IP Insights アルゴリズムは、検証時に validation:discriminator_auc
メトリクスを計算します。その値は、ハイパーパラメータ調整を最適化する目標関数として使用されます。
メトリクス名 | 説明 | 最適化の方向 |
---|---|---|
validation:discriminator_auc |
検証データセットの受信者動作特性曲線の下の領域。検証データセットはラベル付けされません。曲線下面積 (AUC) は、検証データポイントとランダムに生成されたデータポイントを区別するモデルの能力を表すメトリクスです。 |
最大化 |
調整可能な IP Insights ハイパーパラメータ
IP Insights アルゴリズムでは、以下のハイパーパラメータを調整できます。 SageMaker
Parameter Name | パラメータタイプ | 推奨範囲 |
---|---|---|
epochs |
IntegerParameterRange |
MinValue: 1, MaxValue: 100 |
learning_rate |
ContinuousParameterRange |
MinValue: 1e-4、 MaxValue:0.1 |
mini_batch_size |
IntegerParameterRanges |
MinValue: 100、 MaxValue:50000 |
num_entity_vectors |
IntegerParameterRanges |
MinValue: 10000、 MaxValue:1000000 |
num_ip_encoder_layers |
IntegerParameterRanges |
MinValue: 1、 MaxValue:10 |
random_negative_sampling_rate |
IntegerParameterRanges |
MinValue: 0, MaxValue: 10 |
shuffled_negative_sampling_rate |
IntegerParameterRanges |
MinValue: 0, MaxValue: 10 |
vector_dim |
IntegerParameterRanges |
MinValue: 8, MaxValue: 256 |
weight_decay |
ContinuousParameterRange |
MinValue: 0.0、 MaxValue:1.0 |