k-NN-Hyperparameter - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

k-NN-Hyperparameter

In der folgenden Tabelle sind die Hyperparameter aufgeführt, die Sie für den Amazon SageMaker AI-Algorithmus k-Nearest Neighbors (k-NN) festlegen können.

Name des Parameters Beschreibung
feature_dim

Die Anzahl der Merkmale der Eingabedaten.

Erforderlich

Gültige Werte: positive Ganzzahl.

k

Die Anzahl der nächsten Nachbarn.

Erforderlich

Gültige Werte: positive Ganzzahl

predictor_type

Der Inferenztyp, der für die Datenbezeichnungen verwendet werden soll.

Erforderlich

Gültige Werte: Classifier für die Klassifizierung oder regressor für die Regression.

sample_size

Die Anzahl der Datenpunkte, die aus dem Trainingsdatensatz gesampelt werden soll.

Erforderlich

Gültige Werte: positive Ganzzahl

dimension_reduction_target

Die Zieldimension, auf die reduziert werden soll.

Erforderlich, wenn Sie den dimension_reduction_type-Parameter angeben.

Gültige Werte: positive Ganzzahl größer als 0 und kleiner als feature_dim.

dimension_reduction_type

Der Typ der Dimensionsreduzierungsmethode.

Optional

Gültige Werte: sign für zufällige Projektion oder fjlt für die schnelle Johnson-Lindenstrauss-Transformation.

Standardwert: Keine Dimensionsreduzierung

faiss_index_ivf_nlists

Die Anzahl der Zentroide, die im Index erstellt werden sollen, wenn er nicht erreicht ist. index_type IVFFlatoder Faiss.IVFPQ.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: auto, der in sqrt(sample_size) aufgelöst wird.

faiss_index_pq_m

Die Anzahl der Vektorsubkomponenten zur Erstellung im Index, wenn index_type auf faiss.IVFPQ eingestellt ist.

Die FAISS-Bibliothek ( FaceBook AI Similarity Search) erfordert, dass der Wert von ein Divisor der faiss_index_pq_m Datendimension ist. Wenn faiss_index_pq_m kein Divisor der Datendimension ist, erhöhen wir die Datendimension auf die kleinste Ganzzahl, die durch faiss_index_pq_m teilbar ist. Wenn keine Dimensionsreduzierung angewendet wird, fügt der Algorithmus eine Auffüllung mit Nullen hinzu. Wenn die Dimensionsreduzierung angewendet wird, erhöht der Algorithmus den Wert des dimension_reduction_target-Hyperparameters.

Optional

Gültige Werte: Eine der folgenden positiven Ganzzahlen: 1, 2, 3, 4, 8, 12, 16, 20, 24, 28, 32, 40, 48, 56, 64, 96

index_metric

Die Metrik, um den Abstand zwischen den Punkten bei der Suche nach den nächsten Nachbarn zu messen. Wenn Trainings mit dem Wert index_type auf faiss.IVFPQ ausgeführt werden, werden INNER_PRODUCT-Entfernung und COSINE-Ähnlichkeit nicht unterstützt.

Optional

Gültige Werte: L2 für die euklidische Entfernung, INNER_PRODUCT für die innere Produktentfernung, COSINE für Kosinusähnlichkeit.

Standardwert: L2

index_type

Der Typ des Index.

Optional

Gültige Werte: faiss.Flat, faiss. IVFFlat, faiss.IVFPQ.

Standardwerte: faiss.Flat

mini_batch_size

Die Anzahl der Beobachtungen pro Mini-Stapel für den Dateniterator.

Optional

Gültige Werte: positive Ganzzahl

Standardwert: 5000