Wählen Sie Ihre Cookie-Einstellungen aus

Wir verwenden essentielle Cookies und ähnliche Tools, die für die Bereitstellung unserer Website und Services erforderlich sind. Wir verwenden Performance-Cookies, um anonyme Statistiken zu sammeln, damit wir verstehen können, wie Kunden unsere Website nutzen, und Verbesserungen vornehmen können. Essentielle Cookies können nicht deaktiviert werden, aber Sie können auf „Anpassen“ oder „Ablehnen“ klicken, um Performance-Cookies abzulehnen.

Wenn Sie damit einverstanden sind, verwenden AWS und zugelassene Drittanbieter auch Cookies, um nützliche Features der Website bereitzustellen, Ihre Präferenzen zu speichern und relevante Inhalte, einschließlich relevanter Werbung, anzuzeigen. Um alle nicht notwendigen Cookies zu akzeptieren oder abzulehnen, klicken Sie auf „Akzeptieren“ oder „Ablehnen“. Um detailliertere Entscheidungen zu treffen, klicken Sie auf „Anpassen“.

k-Means-Hyperparameter

Fokusmodus
k-Means-Hyperparameter - Amazon SageMaker KI

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

In der CreateTrainingJob-Anforderung geben Sie den Trainingsalgorithmus an, den Sie verwenden möchten. Sie können auch algorithmusspezifische Hyperparameter als Maps angeben. string-to-string In der folgenden Tabelle sind die Hyperparameter für den K-Means-TrainingsalGORITHmus aufgeführt, der von Amazon SageMaker AI bereitgestellt wird. Weitere Informationen zur Funktionsweise von k-Means-Clustering finden Sie unter So funktioniert das Clustering mit k-Means-Algorithmen.

Name des Parameters Beschreibung
feature_dim

Die Anzahl der Merkmale der Eingabedaten.

Erforderlich

Gültige Werte: Positive Ganzzahl

k

Die Anzahl der erforderlichen Cluster.

Erforderlich

Gültige Werte: Positive Ganzzahl

epochs

Die Anzahl der mit den Trainingsdaten durchgeführten Durchläufe.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 1

eval_metrics

Eine JSON-Liste der Metriktypen, die zum Melden einer Punktzahl für das Modell verwendet werden. Zulässige Werte sind msd für den mittleren quadratischen Abweichung und ssd für die Summe der quadrierten Abstände. Wenn Testdaten angegeben werden, die Punktzahl für jede der angeforderten Metriken gemeldet.

Optional

Gültige Werte: entweder [\"msd\"], [\"ssd\"] oder [\"msd\",\"ssd\"].

Standardwert: [\"msd\"]

extra_center_factor

Der Algorithmus erstellt K Zentren = num_clusters * extra_center_factor während der Ausführung und reduziert die Anzahl der Zentren bei der Fertigstellung des Modells von K auf k.

Optional

Gültige Werte: entweder eine positive Ganzzahl oder auto.

Standardwert: auto

half_life_time_size

Wird verwendet, um die Gewichtung zu bestimmen, die einer Beobachtung beim Berechnen eines Clustermittelwerts zugeteilt wird. Die Gewichtung zerfällt exponentiell, sobald mehrere Punkte beobachtet werden. Bei der ersten Beobachtung eines Punkts wird ihm eine Gewichtung von 1 bei der Berechnung des Clustermittelwerts zugeteilt. Die Zerfallkonstante für die exponentielle Funktion wird ausgewählt, sodass die Gewichtung nach Beobachtung von half_life_time_size Punkten 1/2 lautet. Wenn er auf 0 festgelegt ist, erfolgt kein Verfall.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 0

init_method

Die Methode, mit der der Algorithmus die anfänglichen Clusterzentren auswählt. Der k-Means-Standardansatz wählt sie nach dem Zufallsprinzip aus. Eine alternative k-Means++-Methode wählt das erste Clusterzentrum nach dem Zufallsprinzip aus. Anschließend wird eine bessere Verteilung der Position des verbleibenden anfänglichen Cluster erzielt, indem die Auswahl von Zentren mit einer Wahrscheinlichkeitsverteilung gewichtet wird, die proportional zum Quadrat der Entfernung der verbleibenden Datenpunkte aus vorhandenen Zentren ist.

Optional

Gültige Werte: Entweder random oder kmeans++.

Standardwert: random

local_lloyd_init_method

Die Initialisierungsmethode für das Expectation Maximization (EM)-Verfahren nach Lloyd, die zum Erstellen des endgültigen Modells mit k-Zentren verwendet wird.

Optional

Gültige Werte: Entweder random oder kmeans++.

Standardwert: kmeans++

local_lloyd_max_iter

Die maximale Anzahl der Iterationen für das Expectation Maximization (EM)-Verfahren nach Lloyd, die zum Erstellen des endgültigen Modells mit k-Zentren verwendet wird.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 300

local_lloyd_num_trials

Gibt an, wie oft das Expectation Maximization (EM)-Verfahren nach Lloyd mit dem geringsten Verlust ausgeführt wird beim Erstellen des endgültigen Modells mit k-Zentren.

Optional

Gültige Werte: entweder eine positive Ganzzahl oder auto.

Standardwert: auto

local_lloyd_tol

Die Toleranz für die Änderung in Verlust zum frühzeitigen Beenden des Expectation Maximization (EM)-Verfahrens nach Lloyd, das zum Erstellen des endgültigen Modells mit k-Zentren verwendet wird.

Optional

Gültige Werte: Gleitkommazahl. Bereich [0, 1].

Standardwert: 0.0001

mini_batch_size

Die Anzahl der Beobachtungen pro Mini-Stapel für den Dateniterator.

Optional

Gültige Werte: Positive Ganzzahl

Standardwert: 5000

DatenschutzNutzungsbedingungen für die WebsiteCookie-Einstellungen
© 2025, Amazon Web Services, Inc. oder Tochtergesellschaften. Alle Rechte vorbehalten.