Algoritmi integrati non supervisionati SageMaker - Amazon SageMaker

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Algoritmi integrati non supervisionati SageMaker

Amazon SageMaker fornisce diversi algoritmi integrati che possono essere utilizzati per una varietà di attività di apprendimento senza supervisione come il clustering, la riduzione delle dimensioni, il riconoscimento di schemi e il rilevamento di anomalie.

  • IP Insights: apprende i modelli di utilizzo degli indirizzi IPv4. È concepito per acquisire associazioni tra indirizzi IPv4 e varie entità, come ID utente o numeri di account.

  • Algoritmo K-Means: trova raggruppamenti discreti all'interno di dati, dove i membri di un gruppo sono il più possibile simili l'uno all'altro e il più possibile diversi dai membri di altri gruppi.

  • Algoritmo di analisi dei componenti principali (PCA): riduce la dimensionalità (numero di funzionalità) all'interno di un set di dati proiettando i punti dati sui primi componenti principali. L'obiettivo è conservare quante più informazioni o variazioni possibili. Per i matematici, i componenti principali sono gli autovettori della matrice di covarianza dei dati.

  • Algoritmo Random Cut Forest (RCF): rileva punti dati anomali all'interno di un set di dati che divergono da dati altrimenti ben strutturati o modellati.

Nome algoritmo Nome canale Modalità di input per l'addestramento Tipo di file Classe di istanza Parallelizzabile
IP Insights addestramento e (facoltativamente) convalida File CSV CPU o GPU
K-Means addestrare e (facoltativamente) testare File o Pipe recordIO-protobuf o CSV CPU o GPUCommon (singolo dispositivo GPU su una o più istanze) No
PCA addestrare e (facoltativamente) testare File o Pipe recordIO-protobuf o CSV GPU o CPU
Random Cut Forest addestrare e (facoltativamente) testare File o Pipe recordIO-protobuf o CSV CPU