Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Algoritmos integrados y modelos previamente entrenados en Amazon SageMaker

Modo de enfoque
Algoritmos integrados y modelos previamente entrenados en Amazon SageMaker - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Amazon SageMaker ofrece un conjunto de algoritmos integrados, modelos previamente entrenados y plantillas de soluciones prediseñadas para ayudar a los científicos de datos y a los profesionales del aprendizaje automático a empezar a entrenar e implementar modelos de aprendizaje automático rápidamente. Para alguien que es nuevo en este campo SageMaker, elegir el algoritmo adecuado para su caso de uso particular puede ser una tarea difícil. En la siguiente tabla se incluye una hoja de referencia rápida en la que se muestra cómo empezar con un ejemplo de problema o caso de uso y encontrar el algoritmo integrado adecuado que ofrezca y SageMaker que sea válido para ese tipo de problema. En las secciones que siguen a la tabla encontrará orientación adicional organizada por paradigmas de aprendizaje (supervisados y no supervisados) y dominios de datos importantes (texto e imágenes).

Tabla: Asignación de casos de uso a algoritmos integrados

Ejemplos de problemas y casos de uso Paradigma o dominio de aprendizaje Tipos de problemas Formato de los datos de entrada Algoritmos integrados

A continuación, se muestran algunos ejemplos de los 15 tipos de problemas que se pueden abordar con los modelos previamente entrenados y las plantillas de soluciones prediseñadas que proporcionan: SageMaker JumpStart

Respuesta a preguntas: un chatbot que genera una respuesta para una pregunta determinada.

Análisis de texto: analice textos de modelos específicos de un ámbito industrial, como las finanzas.

Modelos prentrenados y plantillas de soluciones prediseñadas

Clasificación de imágenes

Clasificación tabular

Regresión tabular

Clasificación de textos

Detección de objetos

Incrustación de texto

Respuesta a preguntas

Clasificación de pares de frases

Incrustación de imágenes

Reconocimiento de entidades con nombre

Segmentación de instancias

Generación de texto

Resumen de texto

Segmentación semántica

Traducción automática

Imagen, texto, tabular

Los modelos más populares, como Mobilenet, YOLO, Faster R-CNN, BERT, LightGBM y CatBoost

Para obtener una lista de los modelos previamente entrenados disponibles, consulte Modelos. JumpStart

Para ver una lista de las plantillas de soluciones prediseñadas disponibles, consulte JumpStart Soluciones.

Predecir si un artículo pertenece a una categoría: un filtro de correo no deseado

Aprendizaje supervisado

Clasificación multiclase/binaria

Tabular

AutoGluon-Tabular, CatBoost, Algoritmo de máquinas de factorización, Algoritmo k vecinos más próximos (k-NN) (K-Nearest Neighbors), LightGBM, Algoritmo de aprendizaje lineal, TabTransformer, XGBoost algoritmo con Amazon SageMaker AI

Predecir un valor numérico/continuo: estimar el valor de una casa

Regresión

Tabular

AutoGluon-Tabular, CatBoost, Algoritmo de máquinas de factorización, Algoritmo k vecinos más próximos (k-NN) (K-Nearest Neighbors), LightGBM, Algoritmo de aprendizaje lineal, TabTransformer, XGBoost algoritmo con Amazon SageMaker AI

En función de los datos históricos de un comportamiento, predecir el comportamiento futuro: predecir las ventas de un nuevo producto en función de los datos de ventas anteriores.

Previsión de serie temporal

Tabular

Utilice el algoritmo de SageMaker previsión AI DeepAR

Mejorar la incrustación de datos de los objetos de alta dimensión: identificar las incidencias de asistencia duplicadas o encontrar la ruta correcta en función de la similitud del texto en las incidencias.

Incrustaciones: convertir objetos de alta dimensión en espacios de baja dimensión. Tabular Algoritmo Object2Vec

Eliminar las columnas de un conjunto de datos que tengan una relación débil con la variable etiqueta/objetivo: el color de un automóvil al predecir su kilometraje.

Aprendizaje no supervisado

Ingeniería de características: reducción de la dimensionalidad

Tabular

Algoritmo de análisis de componente principal (PCA)

Detectar un comportamiento anormal en la aplicación: detectar si un sensor de IoT envía lecturas anormales

Detección de anomalías

Tabular

Algoritmo de bosque de corte aleatorio (RCF)

Proteger su aplicación de usuarios sospechosos: detectar si la dirección IP que accede a un servicio puede provenir de un origen peligroso

Detección de anomalías IP

Tabular

Información de IP

Agrupar objetos o datos similares: buscar clientes con gastos altos, medios y bajos a partir de sus historiales de transacciones

Clustering o agrupación

Tabular

Algoritmo k-means

Organizar un conjunto de documentos en temas (no conocidos de antemano): etiquetar un documento como perteneciente a una categoría médica según los términos utilizados en el documento.

Modelado de temas

Texto

Algoritmo Asignación latente de Dirichlet (LDA), Algoritmo de Modelo de tema neuronal (NTM)

Asignar categorías predefinidas a los documentos de un corpus: clasificar los libros de una biblioteca en disciplinas académicas

Análisis textual

Clasificación de textos

Texto

BlazingText algoritmo, Clasificación de textos - TensorFlow

Convertir texto de un idioma a otro: español a inglés

Traducción automática

algoritmo
Texto

Sequence-to-Sequence Algoritmo

Resumir un corpus de texto largo: un resumen para un artículo de investigación

Resumen de texto

Texto

Sequence-to-Sequence Algoritmo

Convertir archivos de audio en texto: transcribir las conversaciones del centro de llamadas para analizarlas más a fondo

S peech-to-text

Texto

Sequence-to-Sequence Algoritmo

Etiquetar una imagen en función del contenido de la imagen: alertas sobre el contenido para adultos de una imagen

Procesamiento de imágenes

Clasificación de etiquetas múltiples e imágenes

Imagen

Clasificación de imágenes - MXNet

Clasificar algo de una imagen mediante el aprendizaje por transferencia.

Clasificación de imágenes Imagen

Clasificación de imágenes - TensorFlow

Detectar personas y objetos en una imagen: la policía revisa una gran galería de fotos en busca de una persona desaparecida

Clasificación y detección de objetos

Imagen

Detección de objetos - MXNet, Detección de objetos - TensorFlow

Etiquetar cada píxel de una imagen de forma individual con una categoría: los coches autónomos se preparan para identificar los objetos que se interponen en su camino

Visión artificial

Imagen

Algoritmo de segmentación semántica

Para obtener información importante sobre los siguientes elementos comunes a todos los algoritmos integrados que proporciona la SageMaker IA, consulteParámetros para algoritmos integrados.

  • Rutas de registro de Docker

  • formatos de datos

  • tipos de EC2 instancias de Amazon recomendados

  • CloudWatch registros

Las siguientes secciones proporcionan orientación adicional para los algoritmos integrados de Amazon SageMaker AI agrupados por los paradigmas de aprendizaje supervisado y no supervisado a los que pertenecen. Para obtener descripciones de estos paradigmas de aprendizaje y sus tipos de problemas asociados, consulte Tipos de algoritmos. También se incluyen secciones sobre los algoritmos integrados de SageMaker IA disponibles para abordar dos importantes dominios del aprendizaje automático: el análisis textual y el procesamiento de imágenes.

Modelos entrenados previamente y plantillas de soluciones

SageMaker JumpStart proporciona una amplia gama de modelos previamente entrenados, plantillas de soluciones prediseñadas y ejemplos de los tipos de problemas más populares. Utilizan el SageMaker SDK y Studio Classic. Para obtener más información sobre estos modelos, soluciones y los cuadernos de ejemplo proporcionados por SageMaker JumpStart, consulteSageMaker JumpStart modelos preentrenados.

Aprendizaje supervisado

Amazon SageMaker AI proporciona varios algoritmos integrados de uso general que se pueden utilizar para problemas de clasificación o regresión.

  • AutoGluon-Tabular: un marco AutoML de código abierto que funciona ensamblando modelos y apilándolos en varias capas.

  • CatBoost: una implementación del algoritmo de árboles potenciados por gradientes, con una potenciación ordenada y un algoritmo innovador para procesar características categóricas.

  • Algoritmo de máquinas de factorización: una extensión de un modelo lineal que se ha diseñado para capturar de manera económica las interacciones entre características dentro de conjuntos de datos dispersos y de grandes dimensiones.

  • Algoritmo k vecinos más próximos (k-NN) (K-Nearest Neighbors): un método no paramétrico que utiliza los k puntos etiquetados más cercanos para asignar un valor. Para la clasificación, es una etiqueta para un nuevo punto de datos. Para la regresión, es un valor objetivo previsto a partir del promedio de los k puntos más cercanos.

  • LightGBM: una implementación del algoritmo de árboles con potenciación por gradiente que añade dos técnicas novedosas para mejorar la eficiencia y la escalabilidad. Estas dos técnicas novedosas son el muestreo unilateral basado en gradientes (GOSS) y la agrupación de características exclusivas (EFB).

  • Algoritmo de aprendizaje lineal: aprende una función lineal para la regresión o una función de umbral lineal para la clasificación.

  • TabTransformer—una novedosa arquitectura de modelado profundo de datos tabulares basada en self-attention-based Transformers.

  • XGBoost algoritmo con Amazon SageMaker AI: una implementación del algoritmo de árboles con potenciación por gradiente que combina un conjunto de estimaciones a partir de un conjunto de modelos más simples y débiles.

Amazon SageMaker AI también proporciona varios algoritmos de aprendizaje supervisado integrados que se utilizan para tareas más especializadas durante la ingeniería de características y la previsión a partir de datos de series temporales.

  • Algoritmo Object2Vec: un nuevo algoritmo multipropósito y altamente personalizable que se utiliza para la ingeniería de características. Puede aprender incrustaciones densas y de baja dimensión de objetos de alta dimensión para producir características que mejoren la eficiencia del entrenamiento en modelos posteriores. Si bien se trata de un algoritmo supervisado, hay muchos escenarios en los que las etiquetas de relación se pueden obtener únicamente a partir de clústeres naturales en los datos. Aunque requiere datos etiquetados para el entrenamiento, esto puede ocurrir sin ninguna anotación humana explícita.

  • Utilice el algoritmo de SageMaker previsión AI DeepAR: un algoritmo de aprendizaje supervisado para series temporales (monodimensionales) escalares y de previsión que emplean redes neuronales recurrentes (RNN).

Aprendizaje no supervisado

Amazon SageMaker AI proporciona varios algoritmos integrados que se pueden usar para una variedad de tareas de aprendizaje sin supervisión. Estas tareas incluyen aspectos como la agrupación en clústeres, la reducción de dimensiones, el reconocimiento de patrones y la detección de anomalías.

  • Algoritmo de análisis de componente principal (PCA): reduce la dimensionalidad (número de características) dentro de un conjunto de datos mediante la proyección de puntos de datos en los primeros componentes principales. El objetivo es retener la mayor cantidad de información o variación posible. Para los matemáticos, los componentes principales son los vectores propios de la matriz de covarianza de los datos.

  • Algoritmo k-means: busca agrupaciones discretas dentro de los datos. Esto se produce cuando los miembros de un mismo grupo tienen el mayor grado de similitud posible entre sí, pero el menor grado de similitud posible con respecto a los miembros de otros grupos.

  • Información de IP—aprende los patrones de uso de las direcciones. IPv4 Está diseñado para capturar las asociaciones entre IPv4 direcciones y diversas entidades, como los números de usuario IDs o de cuenta.

  • Algoritmo de bosque de corte aleatorio (RCF): detecta puntos de datos anómalos dentro de un conjunto de datos divergente con respecto a datos que, por todo lo demás, tienen un buen nivel de organización o uniformidad.

Análisis textual

SageMaker La IA proporciona algoritmos que se adaptan al análisis de documentos textuales. Esto incluye el texto empleado en el procesamiento del lenguaje natural, la clasificación o el resumen de documentos, el modelado o la clasificación de temas y la transcripción o traducción de lenguaje.

  • BlazingText algoritmo: una implementación muy optimizada del Word2vec y de los algoritmos de clasificación de textos que se adapta fácilmente a grandes conjuntos de datos. Resulta útil para muchas tareas de salida en el procesamiento de lenguaje natural (NLP).

  • Sequence-to-Sequence Algoritmo: un algoritmo supervisado que se utiliza normalmente para la traducción automática neuronal.

  • Algoritmo Asignación latente de Dirichlet (LDA): este algoritmo es idóneo para determinar temas en un conjunto de documentos. Se trata de un algoritmo no supervisado, lo que significa que no utiliza datos de ejemplo con respuestas durante la capacitación.

  • Algoritmo de Modelo de tema neuronal (NTM): otra técnica no supervisada para determinar temas en un conjunto de documentos, con una estrategia de redes neuronales.

  • Clasificación de textos - TensorFlow: un algoritmo supervisado para el aprendizaje por transferencia con modelos prentrenados disponibles para la clasificación de textos.

Procesamiento de imágenes

SageMaker La IA también proporciona algoritmos de procesamiento de imágenes que se utilizan para la clasificación de imágenes, la detección de objetos y la visión artificial.

  • Clasificación de imágenes - MXNet: usa datos de ejemplo con respuestas (conocido como algoritmo supervisado). Utilice este algoritmo para clasificar imágenes.

  • Clasificación de imágenes - TensorFlow—Utiliza modelos TensorFlow Hub previamente entrenados para ajustarlos a tareas específicas (lo que se denomina algoritmo supervisado). Utilice este algoritmo para clasificar imágenes.

  • Algoritmo de segmentación semántica: proporciona un sistema de nivel de píxel detallado para desarrollar aplicaciones de visión artificial.

  • Detección de objetos - MXNet: detecta y clasifica los objetos de las imágenes mediante una única red neuronal profunda. Es un algoritmo de aprendizaje supervisado que toma como entrada e identifica todas las instancias de objetos dentro de la escena de una imagen.

  • Detección de objetos - TensorFlow: detecta los cuadros delimitadores y las etiquetas de los objetos de una imagen. Se trata de un algoritmo de aprendizaje supervisado que apoya el aprendizaje por transferencia con los modelos preentrenados disponibles. TensorFlow

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.