Informações comuns sobre algoritmos integrados - Amazon SageMaker

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Informações comuns sobre algoritmos integrados

A tabela a seguir lista os parâmetros para cada um dos algoritmos fornecidos pela Amazon SageMaker.

Nome do algoritmo Nome do canal Modo de entrada do treinamento Tipo de arquivo Classe de instância Paralelizável
AutoGluon-Tabular treinamento e (opcionalmente) validação Arquivo CSV CPUou GPU (somente instância única) Não
BlazingText treinamento Arquivo ou Pipe Arquivo de texto (uma frase por linha com tokens separados por espaço) CPUou GPU (somente instância única) Não
CatBoost treinamento e (opcionalmente) validação Arquivo CSV CPU(somente instância única) Não
Previsão DeepAR treinamento e (opcionalmente) teste Arquivo JSONLinhas ou parquet CPUou GPU Sim
Máquinas de fatoração treinamento e (opcionalmente) teste Arquivo ou Pipe recordIO-protobuf CPU(GPUpara dados densos) Sim
Classificação de imagens - MXNet treinamento e validação, (opcionalmente) train_lst, validation_lst e model Arquivo ou Pipe recordIO ou arquivos de imagem (.jpg ou .png) GPU Sim
Classificação de imagens - TensorFlow treinamento e validação Arquivo arquivos de imagem (.jpg, .jpeg ou .png) CPUou GPU Sim (somente em vários GPUs em uma única instância)
IP Insights treinamento e (opcionalmente) validação Arquivo CSV CPUou GPU Sim
K-Means treinamento e (opcionalmente) teste Arquivo ou Pipe Recordio-protobuf ou CSV CPUou GPUCommon (GPUdispositivo único em uma ou mais instâncias) Não
K-Nearest-Neighbors (k-NN) treinamento e (opcionalmente) teste Arquivo ou Pipe Recordio-protobuf ou CSV CPUou GPU (GPUdispositivo único em uma ou mais instâncias) Sim
LDA treinamento e (opcionalmente) teste Arquivo ou Pipe Recordio-protobuf ou CSV CPU(somente instância única) Não
Luz GBM treino/treinamento e (opcionalmente) validação Arquivo CSV CPU Sim
Aprendizagem linear treinamento e (opcionalmente) validação, teste ou ambos Arquivo ou Pipe Recordio-protobuf ou CSV CPUou GPU Sim
Modelo de tópico neural treinamento e (opcionalmente) validação, teste ou ambos Arquivo ou Pipe Recordio-protobuf ou CSV CPUou GPU Sim
Object2Vec treinamento e (opcionalmente) validação, teste ou ambos Arquivo JSONLinhas CPUou GPU (somente instância única) Não
Detecção de objetos - MXNet treinamento e validação, (opcionalmente) train_annotation, validation_annotation e model Arquivo ou Pipe recordIO ou arquivos de imagem (.jpg ou .png) GPU Sim
Detecção de objetos - TensorFlow treinamento e validação Arquivo arquivos de imagem (.jpg, .jpeg ou .png) GPU Sim (somente em vários GPUs em uma única instância)
PCA treinamento e (opcionalmente) teste Arquivo ou Pipe Recordio-protobuf ou CSV CPUou GPU Sim
Random Cut Forest treinamento e (opcionalmente) teste Arquivo ou Pipe Recordio-protobuf ou CSV CPU Sim
Segmentação de semântica treinamento e validação, train_annotation, validation_annotation e (opcionalmente) label_map e model Arquivo ou Pipe Arquivos de imagem GPU(somente instância única) Não
Modelagem Seq2Seq treinamento, validação e vocabulário Arquivo recordIO-protobuf GPU(somente instância única) Não
TabTransformer treinamento e (opcionalmente) validação Arquivo CSV CPUou GPU (somente instância única) Não
Classificação de texto - TensorFlow treinamento e validação Arquivo CSV CPUou GPU Sim (somente em vários GPUs em uma única instância)
XGBoost(0,90-1, 0,90-2, 1,0-1, 1,2-1, 1,2-21) treinamento e (opcionalmente) validação Arquivo ou Pipe CSV, Lib ou SVM Parquet CPU(ou GPU para 1,2-1) Sim

Algoritmos que são paralelizáveis podem ser implantados em várias instâncias de computação para treinamento distribuído.

Os tópicos a seguir fornecem informações sobre formatos de dados, tipos de EC2 instância recomendados da Amazon e CloudWatch registros comuns a todos os algoritmos integrados fornecidos pela Amazon SageMaker.

nota

Para pesquisar a imagem do Docker URIs dos algoritmos integrados gerenciados por SageMaker, consulte Caminhos de registro do Docker e código de exemplo.