K-Means ハイパーパラメータ
CreateTrainingJob
リクエストで、使用するトレーニングアルゴリズムを指定します。また、アルゴリズム固有のハイパーパラメータを文字列から文字列へのマップとして指定することもできます。次の表に、Amazon SageMaker によって提供される k-means トレーニングアルゴリズムのハイパーパラメータを示します。k-means クラスタリングの仕組みの詳細については、「K-Means クラスタリングの仕組み」を参照してください。
Parameter Name | 説明 |
---|---|
feature_dim |
入力データ内の特徴の数。 必須 有効な値: 正の整数 |
k |
必要なクラスターの数。 必須 有効な値: 正の整数 |
epochs |
トレーニングデータに対して実行するパスの数。 オプション 有効な値: 正の整数 デフォルト値: 1 |
eval_metrics |
モデルのスコアを報告するために使用されるメトリクスタイプの JSON リスト。許容値は、平均二乗偏差の場合 オプション 有効な値: デフォルト値: |
extra_center_factor |
アルゴリズムは、実行時に K 個の中心 = オプション 有効な値: 正の整数または デフォルト値: |
half_life_time_size |
クラスター平均を計算するときに観測に付ける重みを決定するために使用されます。この重みは、観測ポイントが増えるにつれて指数関数的に減衰します。ポイントが最初に観測される際、クラスターの平均の計算時に 1 の重みが割り当てられます。 オプション 有効な値: 負以外の整数 デフォルト値: 0 |
init_method |
アルゴリズムが初期クラスターの中心を選択する方法。標準的な k-means アプローチがランダムに選択します。別の k-means++ 法では、初期クラスターの中心をランダムに選択します。さらに、既存の中心からの残りのデータポイントの距離の 2 乗に比例する確率分布で中心の選択に重み付けすることによって、残りの初期クラスターの位置を広げます。 オプション 有効な値: デフォルト値: |
local_lloyd_init_method |
オプション 有効な値: デフォルト値: |
local_lloyd_max_iter |
オプション 有効な値: 正の整数 デフォルト値: 300 |
local_lloyd_num_trials |
オプション 有効な値: 正の整数または デフォルト値: |
local_lloyd_tol |
オプション 有効な値: 浮動小数点数。[0, 1] の範囲です。 デフォルト値: 0.0001 |
mini_batch_size |
データイテレーターのミニバッチごとの観測数。 オプション 有効な値: 正の整数 デフォルト値: 5000 |