Algoritmos integrados não supervisionados SageMaker - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Algoritmos integrados não supervisionados SageMaker

SageMaker A Amazon fornece vários algoritmos integrados que podem ser usados para uma variedade de tarefas de aprendizado não supervisionadas, como agrupamento, redução de dimensões, reconhecimento de padrões e detecção de anomalias.

  • IP Insights—aprende os padrões de uso dos endereços IPv4. Ele é projetado para capturar associações entre endereços IPv4 e várias entidades, como IDs de usuários ou números de contas.

  • Algoritmo k-means: encontra agrupamentos distintos dentro dos dados, em que os membros de um grupo sejam o mais semelhantes possível entre eles e o mais diferentes possível dos membros de outros grupos.

  • Algoritmo de análise de componentes principais (PCA): reduz a dimensionalidade (número de atributos) em um conjunto de dados projetando pontos de dados nos primeiros componentes principais. O objetivo é reter o máximo possível de informações ou variações. Para matemáticos, os componentes principais são os autovetores da matriz de covariância dos dados.

  • Algoritmo Random Cut Forest (RCF): detecta pontos de dados anômalos em um conjunto de dados que divergem de dados bem estruturados ou padronizados.

Nome do algoritmo Nome do canal Modo de entrada do treinamento Tipo de arquivo Classe de instância Paralelizável
IP Insights treinamento e (opcionalmente) validação Arquivo CSV CPU ou GPU Sim
K-Means treinamento e (opcionalmente) teste Arquivo ou Pipe recordIO-protobuf ou CSV CPU ou GPUCommon (dispositivo de GPU única em uma ou mais instâncias) Não
PCA treinamento e (opcionalmente) teste Arquivo ou Pipe recordIO-protobuf ou CSV GPU ou CPU Sim
Random Cut Forest treinamento e (opcionalmente) teste Arquivo ou Pipe recordIO-protobuf ou CSV CPU Sim