k-NN ハイパーパラメータ - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

k-NN ハイパーパラメータ

次の表に、Amazon SageMaker AI の k 最近傍 (k-NN) アルゴリズムに設定できるハイパーパラメータを示します。

Parameter Name 説明
feature_dim

入力データ内の特徴の数。

必須

有効な値: 正の整数。

k

最近傍の数。

必須

有効な値: 正の整数

predictor_type

データラベルに使用する推論のタイプ。

必須

有効な値: 分類の場合は classifier、回帰の場合は regressor

sample_size

トレーニングデータセットからサンプリングされるデータポイントの数。

必須

有効な値: 正の整数

dimension_reduction_target

縮小後の標的次元。

dimension_reduction_type パラメータを指定する場合に必須です。

有効な値: 0 より大きく、feature_dim より小さい正の整数。

dimension_reduction_type

次元削減手法のタイプ。

オプション

有効な値: ランダム射影の場合は sign 、高速 Johnson-Lindenstrauss 変換の場合は fjlt

デフォルト値: 次元削減なし

faiss_index_ivf_nlists

index_typefaiss.IVFFlat または faiss.IVFPQ である場合に、インデックス内で作成する重心の数。

オプション

有効な値: 正の整数

デフォルト値: auto (sqrt(sample_size) に解決される)。

faiss_index_pq_m

index_typefaiss.IVFPQ に設定されている場合に、インデックス内で作成するベクトルサブコンポーネントの数。

FaceBook AI 類似検索 (FAISS) ライブラリでは、faiss_index_pq_m の値がデータ次元の約数であることが必要です。faiss_index_pq_m がデータ次元の約数でない場合は、データ次元を faiss_index_pq_m で割り切れる最小の整数に増やします。次元削減が適用されない場合、アルゴリズムはゼロのパディングを追加します。次元削減が適用される場合、アルゴリズムは dimension_reduction_target ハイパーパラメータの値を大きくします。

オプション

有効な値: 次の正の整数の 1 つ:1、2、3、4、8、12、16、20、24、28、32、40、48、56、64、96

index_metric

最近傍を見つけるときにポイント間の距離を測定するためのメトリクス。index_typefaiss.IVFPQ に設定してトレーニングする場合、INNER_PRODUCT 距離と COSINE 類似度はサポートされません。

オプション

有効な値: ユークリッド距離の場合は L2、内積距離の場合は INNER_PRODUCT、余弦類似度の場合は COSINE

デフォルト値: L2

index_type

インデックスのタイプ。

オプション

有効な値: faiss.Flatfaiss.IVFFlatfaiss.IVFPQ

デフォルト値: faiss.Flat

mini_batch_size

データイテレーターのミニバッチごとの観測数。

オプション

有効な値: 正の整数

デフォルト値: 5000