Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Información común sobre los algoritmos integrados
En la siguiente tabla se muestran los parámetros de cada uno de los algoritmos proporcionados por Amazon SageMaker.
Nombre de algoritmo | Nombre de canal | Modo de entrada de capacitación | Tipo de archivo | Clase de instancia | Paralelizable |
---|---|---|---|---|---|
AutoGluon-Tabular | entrenamiento y validación (opcional) | Archivos | CSV | CPUo GPU (solo instancia única) | No |
BlazingText | capacitación | Archivo o canalización | Archivo de texto (una frase por línea con tokens separados por espacios) | CPUo GPU (solo instancia única) | No |
CatBoost | entrenamiento y validación (opcional) | Archivos | CSV | CPU(solo instancia única) | No |
Previsión DeepAR | capacitación y prueba (opcional) | Archivos | JSON¿Líneas o parquet | CPUo GPU | Sí |
Máquinas de factorización | capacitación y prueba (opcional) | Archivo o canalización | recordIO-protobuf | CPU(GPUpara datos densos) | Sí |
Clasificación de imágenes - MXNet | capacitación y validación, (opcional) train_lst, validation_lst y modelo | Archivo o canalización | recordIO o archivos de imagen (.jpg o .png) | GPU | Sí |
Clasificación de imágenes - TensorFlow | entrenamiento y validación | Archivos | archivos de imagen (.jpg, .jpeg o.png) | CPUo GPU | Sí (solo en varios casos GPUs en una sola instancia) |
Información de IP | capacitación y validación (opcional) | Archivos | CSV | CPUo GPU | Sí |
K-Means | capacitación y prueba (opcional) | Archivo o canalización | Recordio-ProtoBuf o CSV | CPUo GPUCommon (un solo GPU dispositivo en una o más instancias) | No |
K-Nearest-Neighbors (k-NN) | capacitación y prueba (opcional) | Archivo o canalización | Recordio-ProtoBuf o CSV | CPUo GPU (un solo GPU dispositivo en una o más instancias) | Sí |
LDA | capacitación y prueba (opcional) | Archivo o canalización | Recordio-ProtoBuf o CSV | CPU(solo instancia única) | No |
Luz GBM | entrenamiento/entrenar y validación (opcional) | Archivos | CSV | CPU | Sí |
Aprendiz lineal | capacitación y validación (opcional), prueba o ambos | Archivo o canalización | Recordio-ProtoBuf o CSV | CPUo GPU | Sí |
Modelo de temas neuronal | capacitación y validación (opcional), prueba o ambos | Archivo o canalización | Recordio-ProtoBuf o CSV | CPUo GPU | Sí |
Object2Vec | capacitación y validación (opcional), prueba o ambos | Archivos | JSONLíneas | CPUo GPU (solo instancia única) | No |
Detección de objetos - MXNet | capacitación y validación, (opcional) train_annotation, validation_annotation y modelo | Archivo o canalización | recordIO o archivos de imagen (.jpg o .png) | GPU | Sí |
Detección de objetos - TensorFlow | entrenamiento y validación | Archivos | archivos de imagen (.jpg, .jpeg o.png) | GPU | Sí (solo en varias instancias GPUs en una sola instancia) |
PCA | capacitación y prueba (opcional) | Archivo o canalización | Recordio-ProtoBuf o CSV | CPUo GPU | Sí |
Bosque de corte aleatorio | capacitación y prueba (opcional) | Archivo o canalización | Recordio-ProtoBuf o CSV | CPU | Sí |
Segmentación semántica | capacitación y validación, train_annotation, validation_annotation y (opcional) label_map y modelo | Archivo o canalización | Archivos de imagen | GPU(solo instancia única) | No |
Modelo Seq2Seq | capacitación, validación y vocabulario | Archivos | recordIO-protobuf | GPU(solo instancia única) | No |
TabTransformer | entrenamiento y validación (opcional) | Archivos | CSV | CPUo GPU (solo instancia única) | No |
Clasificación de texto - TensorFlow | entrenamiento y validación | Archivos | CSV | CPUo GPU | Sí (solo en varios casos GPUs en una sola instancia) |
XGBoost(0.90-1, 0.90-2, 1.0-1, 1.2-1, 1.2-21) | capacitación y validación (opcional) | Archivo o canalización | CSVSVM, Lib o Parquet | CPU(o GPU para 1.2-1) | Sí |
Los algoritmos que son paralelizables se pueden implementar en varias instancias de cómputo para capacitación distribuida.
En los temas siguientes se proporciona información sobre los formatos de datos, los tipos de EC2 instancias de Amazon recomendados y los CloudWatch registros comunes a todos los algoritmos integrados que proporciona Amazon SageMaker.
nota
Para buscar la imagen URIs de Docker de los algoritmos integrados gestionados por ellos SageMaker, consulta las rutas de registro y el código de ejemplo de Docker.