Unüberwachte integrierte SageMaker Algorithmen - Amazon SageMaker

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Unüberwachte integrierte SageMaker Algorithmen

Amazon SageMaker bietet mehrere integrierte Algorithmen, die für eine Vielzahl von Aufgaben des unüberwachten Lernens wie Clustering, Dimensionsreduzierung, Mustererkennung und Anomalieerkennung verwendet werden können.

  • IP Insights – lernt die Nutzungsmuster für IPv4-Adressen kennen. Er wurde entwickelt, um Zuordnungen zwischen IPv4-Adressen und verschiedenen Entitys, wie beispielsweise Benutzer-IDs oder Kontonummern, zu erfassen.

  • k-Means-Algorithmus—versucht, diskrete Gruppierungen innerhalb von Daten zu finden, wobei Mitglieder einer Gruppe sich so ähnlich wie möglich sein sollen und sich so stark wie möglich von Mitgliedern anderer Gruppen unterscheiden sollen.

  • Algorithmus für die Hauptkomponentenanalyse (PCA)—reduziert die Dimensionalität (Anzahl der Features) innerhalb eines Datensatzes, indem Datenpunkte auf die ersten Hauptkomponenten projiziert werden. Ziel ist es, so viele Informationen oder Variationen wie möglich beizubehalten. Für Mathematiker sind die Hauptkomponenten Eigenvektoren der Kovarianzmatrix der Daten.

  • Random Cut Forest (RCF) -Algorithmus—erkennt anomale Datenpunkte innerhalb eines Datensatzes, die von ansonsten gut strukturierten oder gemusterten Daten abweichen.

Name des Algorithmus Kanalname Schulungseingangsmodus Dateityp Instance-Klasse Parallelisierbar
IP Insights "train" und (optional) "validation" Datei CSV CPU oder GPU Ja
K-Means "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU- oder GPUCommon (einzelnes GPU-Gerät auf einer oder mehreren Instances) Nein
PCA "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV GPU oder CPU Ja
Random Cut Forest "train" und (optional) "test" Datei oder Pipe recordIO-protobuf oder CSV CPU Ja