Información común sobre los algoritmos integrados - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Información común sobre los algoritmos integrados

En la siguiente tabla se muestran los parámetros de cada uno de los algoritmos proporcionados por Amazon SageMaker.

Nombre de algoritmo Nombre de canal Modo de entrada de capacitación Tipo de archivo Clase de instancia Paralelizable
AutoGluon-Tabular entrenamiento y validación (opcional) Archivos CSV CPUo GPU (solo instancia única) No
BlazingText capacitación Archivo o canalización Archivo de texto (una frase por línea con tokens separados por espacios) CPUo GPU (solo instancia única) No
CatBoost entrenamiento y validación (opcional) Archivos CSV CPU(solo instancia única) No
Previsión DeepAR capacitación y prueba (opcional) Archivos JSON¿Líneas o parquet CPUo GPU
Máquinas de factorización capacitación y prueba (opcional) Archivo o canalización recordIO-protobuf CPU(GPUpara datos densos)
Clasificación de imágenes - MXNet capacitación y validación, (opcional) train_lst, validation_lst y modelo Archivo o canalización recordIO o archivos de imagen (.jpg o .png) GPU
Clasificación de imágenes - TensorFlow entrenamiento y validación Archivos archivos de imagen (.jpg, .jpeg o.png) CPUo GPU Sí (solo en varios casos GPUs en una sola instancia)
Información de IP capacitación y validación (opcional) Archivos CSV CPUo GPU
K-Means capacitación y prueba (opcional) Archivo o canalización Recordio-ProtoBuf o CSV CPUo GPUCommon (un solo GPU dispositivo en una o más instancias) No
K-Nearest-Neighbors (k-NN) capacitación y prueba (opcional) Archivo o canalización Recordio-ProtoBuf o CSV CPUo GPU (un solo GPU dispositivo en una o más instancias)
LDA capacitación y prueba (opcional) Archivo o canalización Recordio-ProtoBuf o CSV CPU(solo instancia única) No
Luz GBM entrenamiento/entrenar y validación (opcional) Archivos CSV CPU
Aprendiz lineal capacitación y validación (opcional), prueba o ambos Archivo o canalización Recordio-ProtoBuf o CSV CPUo GPU
Modelo de temas neuronal capacitación y validación (opcional), prueba o ambos Archivo o canalización Recordio-ProtoBuf o CSV CPUo GPU
Object2Vec capacitación y validación (opcional), prueba o ambos Archivos JSONLíneas CPUo GPU (solo instancia única) No
Detección de objetos - MXNet capacitación y validación, (opcional) train_annotation, validation_annotation y modelo Archivo o canalización recordIO o archivos de imagen (.jpg o .png) GPU
Detección de objetos - TensorFlow entrenamiento y validación Archivos archivos de imagen (.jpg, .jpeg o.png) GPU Sí (solo en varias instancias GPUs en una sola instancia)
PCA capacitación y prueba (opcional) Archivo o canalización Recordio-ProtoBuf o CSV CPUo GPU
Bosque de corte aleatorio capacitación y prueba (opcional) Archivo o canalización Recordio-ProtoBuf o CSV CPU
Segmentación semántica capacitación y validación, train_annotation, validation_annotation y (opcional) label_map y modelo Archivo o canalización Archivos de imagen GPU(solo instancia única) No
Modelo Seq2Seq capacitación, validación y vocabulario Archivos recordIO-protobuf GPU(solo instancia única) No
TabTransformer entrenamiento y validación (opcional) Archivos CSV CPUo GPU (solo instancia única) No
Clasificación de texto - TensorFlow entrenamiento y validación Archivos CSV CPUo GPU Sí (solo en varios casos GPUs en una sola instancia)
XGBoost(0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21) capacitación y validación (opcional) Archivo o canalización CSVSVM, Lib o Parquet CPU(o GPU para 1.2-1)

Los algoritmos que son paralelizables se pueden implementar en varias instancias de cómputo para capacitación distribuida.

En los temas siguientes se proporciona información sobre los formatos de datos, los tipos de EC2 instancias de Amazon recomendados y los CloudWatch registros comunes a todos los algoritmos integrados que proporciona Amazon SageMaker.

nota

Para buscar la imagen URIs de Docker de los algoritmos integrados gestionados por ellos SageMaker, consulta las rutas de registro y el código de ejemplo de Docker.