k-NN ハイパーパラメータ - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

k-NN ハイパーパラメータ

次の表に、Amazon SageMaker k-nearest neighbors (k-NN) アルゴリズムに設定できるハイパーパラメータを示します。

Parameter Name 説明
feature_dim

入力データ内の特徴の数。

必須

有効な値: 正の整数。

k

最近傍の数。

必須

有効な値: 正の整数

predictor_type

データラベルに使用する推論のタイプ。

必須

有効な値: 分類の場合は classifier、回帰の場合は regressor

sample_size

トレーニングデータセットからサンプリングされるデータポイントの数。

必須

有効な値: 正の整数

dimension_reduction_target

縮小後の標的次元。

dimension_reduction_type パラメータを指定する場合に必須です。

有効な値: 0 より大きく、feature_dim より小さい正の整数。

dimension_reduction_type

次元削減手法のタイプ。

オプション

有効な値: ランダム射影の場合は sign 、高速 Johnson-Lindenstrauss 変換の場合は fjlt

デフォルト値: 次元削減なし

faiss_index_ivf_nlists

index_typefaiss.IVFFlat または faiss. の場合にインデックスに構築する重心の数IVFPQ

オプション

有効な値: 正の整数

デフォルト値: auto (sqrt(sample_size) に解決される)。

faiss_index_pq_m

index_typefaiss に設定されている場合にインデックスに構築するベクトルサブコンポーネントの数IVFPQ

FaceBook AI 類似性検索 (FAISS) ライブラリではfaiss_index_pq_m、 の値がデータディメンションの除数であることが必要です。faiss_index_pq_m がデータ次元の約数でない場合は、データ次元を faiss_index_pq_m で割り切れる最小の整数に増やします。次元削減が適用されない場合、アルゴリズムはゼロのパディングを追加します。次元削減が適用される場合、アルゴリズムは dimension_reduction_target ハイパーパラメータの値を大きくします。

オプション

有効な値: 次の正の整数の 1 つ:1、2、3、4、8、12、16、20、24、28、32、40、48、56、64、96

index_metric

最近傍を見つけるときにポイント間の距離を測定するためのメトリクス。index_typefaiss.IVFPQ に設定してトレーニングする場合、INNER_PRODUCT 距離と COSINE 類似度はサポートされません。

オプション

有効な値: ユークリッド距離の L2、製品内距離の INNER_PRODUCTCOSINEコサインの類似性。

デフォルト値: L2

index_type

インデックスのタイプ。

オプション

有効な値: faiss.Flat faiss.IVFFlatfaiss.IVFPQ

デフォルト値: faiss.Flat

mini_batch_size

データイテレーターのミニバッチごとの観測数。

オプション

有効な値: 正の整数

デフォルト値: 5000