Seleccione sus preferencias de cookies

Usamos cookies esenciales y herramientas similares que son necesarias para proporcionar nuestro sitio y nuestros servicios. Usamos cookies de rendimiento para recopilar estadísticas anónimas para que podamos entender cómo los clientes usan nuestro sitio y hacer mejoras. Las cookies esenciales no se pueden desactivar, pero puede hacer clic en “Personalizar” o “Rechazar” para rechazar las cookies de rendimiento.

Si está de acuerdo, AWS y los terceros aprobados también utilizarán cookies para proporcionar características útiles del sitio, recordar sus preferencias y mostrar contenido relevante, incluida publicidad relevante. Para aceptar o rechazar todas las cookies no esenciales, haga clic en “Aceptar” o “Rechazar”. Para elegir opciones más detalladas, haga clic en “Personalizar”.

Entrenamiento de modelos

Modo de enfoque
Entrenamiento de modelos - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

La etapa de entrenamiento del ciclo de vida completo de machine learning (ML) abarca desde el acceso al conjunto de datos de entrenamiento hasta la generación de un modelo final y la selección del modelo con mejor rendimiento para su implementación. En las siguientes secciones se ofrece una descripción general de las funciones y los recursos de SageMaker formación disponibles, con información técnica detallada sobre cada uno de ellos.

La arquitectura básica de SageMaker Training

Si es la primera vez que utilizas la SageMaker IA y quieres encontrar una solución rápida de aprendizaje automático para entrenar un modelo en tu conjunto de datos, considera la posibilidad de utilizar una solución sin código o con poco código, como SageMaker Canvas, JumpStarten SageMaker Studio Classic, o SageMaker Autopilot.

Para experiencias de programación de nivel intermedio, considere la posibilidad de utilizar una libreta SageMaker Studio Classic o Notebook InstancesSageMaker . Para empezar, sigue las instrucciones de la guía Capacitación de un modelo de introducción a la SageMaker IA. Lo recomendamos para los casos de uso en los que cree su propio modelo y script de entrenamiento utilizando un marco de ML.

El núcleo de los trabajos de SageMaker IA es la contenedorización de las cargas de trabajo de aprendizaje automático y la capacidad de gestionar los recursos informáticos. La plataforma de SageMaker formación se encarga del trabajo pesado asociado a la configuración y la gestión de la infraestructura para las cargas de trabajo de formación en aprendizaje automático. Con SageMaker Training, puede centrarse en desarrollar, capacitar y ajustar su modelo.

El siguiente diagrama de arquitectura muestra cómo la SageMaker IA gestiona los trabajos de formación en aprendizaje automático y aprovisiona las EC2 instancias de Amazon en nombre de los usuarios de SageMaker IA. Como usuario de SageMaker IA, puede traer su propio conjunto de datos de entrenamiento y guardarlo en Amazon S3. Puede elegir un modelo de aprendizaje automático entre los algoritmos integrados de SageMaker IA disponibles, o bien utilizar su propio guion de entrenamiento con un modelo creado con los marcos de aprendizaje automático más populares.

La forma en que los usuarios proporcionan los datos y eligen los algoritmos, y la SageMaker IA aprovisiona la infraestructura informática.

Vista completa del flujo de trabajo y las características de la SageMaker formación

El proceso completo de entrenamiento en ML incluye tareas que van más allá de la ingesta de datos para obtener modelos de ML, el entrenamiento de modelos en instancias de procesamiento y la obtención de artefactos y resultados de los modelos. Debe evaluar todas las fases de antes, durante y después del entrenamiento para asegurarse de que su modelo está bien entrenado para cumplir la precisión deseada para sus objetivos.

El siguiente diagrama de flujo muestra una descripción general de alto nivel de sus acciones (en recuadros azules) y las funciones de SageMaker capacitación disponibles (en recuadros de color azul claro) a lo largo de la fase de capacitación del ciclo de vida del aprendizaje automático.

Diagrama de flujo de los pasos y características recomendados que se deben utilizar en cada paso del flujo de trabajo de entrenamiento de ML

En las siguientes secciones, se explica cada una de las fases del entrenamiento, descritas en el diagrama de flujo anterior, así como las útiles funciones que ofrece la SageMaker IA a lo largo de las tres subetapas de la formación en aprendizaje automático.

Antes del entrenamiento

Hay varios escenarios de configuración de los recursos y el acceso a los datos que hay que tener en cuenta antes del entrenamiento. Consulte el siguiente diagrama y los detalles de cada etapa previa al entrenamiento para hacerse una idea de las decisiones que debe tomar.

Un diagrama de flujo que muestra las tareas previas al entrenamiento y las funciones de SageMaker IA asociadas

Durante el entrenamiento

Durante el entrenamiento, es necesario mejorar continuamente la estabilidad, la velocidad y la eficiencia de la misma, a la vez que se amplían los recursos de cómputo, se optimizan los costes y, lo que es más importante, el rendimiento del modelo. Sigue leyendo para obtener más información sobre las etapas de entrenamiento durante el entrenamiento y las funciones relevantes del entrenamiento. SageMaker

Un diagrama de flujo que muestra las tareas durante el entrenamiento y las funciones de IA asociadas SageMaker
  • Configure la infraestructura: elija el tipo de instancia y las herramientas de administración de infraestructura adecuados para su caso de uso. Puede empezar desde una instancia pequeña y ampliarla en función de su carga de trabajo. Para formar un modelo en un conjunto de datos tabular, comience con la instancia de CPU más pequeña de las familias de instancias C4 o C5. Para formar un modelo grande para la visión artificial o el procesamiento del lenguaje natural, comience con la instancia de GPU más pequeña de las familias de instancias P2, P3, G4dn o G5. También puedes combinar distintos tipos de instancias en un clúster o mantener las instancias en grupos cálidos con las siguientes herramientas de administración de instancias que ofrece la SageMaker IA. También puede utilizar la caché persistente para reducir la latencia y el tiempo facturable en los trabajos de entrenamiento iterativos, en lugar de reducir la latencia únicamente en los grupos cálidos. Para obtener más información, consulte los temas siguientes.

    Debe tener una cuota suficiente para realizar un trabajo de entrenamiento. Si realiza su trabajo de entrenamiento en una instancia en el que su cuota es insuficiente, recibirá un error ResourceLimitExceeded. Para comprobar las cuotas actualmente disponibles en su cuenta, utilice la consola Service Quotas. Para obtener más información sobre cómo solicitar un aumento de cuotas, consulte Cuotas y regiones compatibles. Además, para encontrar información sobre los precios y los tipos de instancias disponibles en función de ellos Regiones de AWS, consulta las tablas de la página de precios de Amazon SageMaker AI.

  • Ejecute un trabajo de formación desde un código local: puede anotar su código local con un decorador remoto para ejecutar el código como un trabajo de SageMaker formación desde Amazon SageMaker Studio Classic, un SageMaker bloc de notas de Amazon o desde su entorno de desarrollo integrado local. Para obtener más información, consulte Ejecuta tu código local como un trabajo SageMaker de formación.

  • Realice un seguimiento de los trabajos de formación: supervise y realice un seguimiento de sus trabajos de formación mediante SageMaker Experiments, SageMaker Debugger o Amazon CloudWatch. Puedes ver el rendimiento del modelo en términos de precisión y convergencia, y realizar un análisis comparativo de las métricas entre varios trabajos de formación mediante experimentos de SageMaker IA. Puede ver la tasa de utilización de los recursos informáticos utilizando las herramientas de creación de perfiles de SageMaker Debugger o Amazon. CloudWatch Para obtener más información, consulte los temas siguientes.

    Además, para las tareas de aprendizaje profundo, utilice las herramientas de SageMaker depuración del modelo Amazon Debugger y las reglas integradas para identificar problemas más complejos en los procesos de convergencia de modelos y actualización de peso.

  • Formación distribuida: si su trabajo de formación va a pasar a una fase estable y no se interrumpe debido a una mala configuración de la infraestructura de formación o a out-of-memory problemas, tal vez le interese buscar más opciones para escalar su trabajo y prolongarlo durante un período de tiempo prolongado, durante días e incluso meses. Cuando esté preparado para ampliarlo, considere la posibilidad de impartir formación distribuida. SageMaker La IA ofrece varias opciones para la computación distribuida, desde cargas de trabajo ligeras de aprendizaje automático hasta cargas de trabajo pesadas de aprendizaje profundo.

    Para las tareas de aprendizaje profundo que impliquen el entrenamiento de modelos muy grandes en conjuntos de datos muy grandes, considere la posibilidad de utilizar una de las estrategias de entrenamiento distribuido de la SageMaker IA para ampliar la escala y lograr el paralelismo de datos, el paralelismo de modelos o una combinación de ambos. También puedes usar SageMaker Training Compiler para compilar y optimizar gráficos de modelos en instancias de GPU. Estas funciones de SageMaker IA son compatibles con marcos de aprendizaje profundo como PyTorch TensorFlow, y Hugging Face Transformers.

  • Ajuste de hiperparámetros del modelo: ajuste los hiperparámetros de su modelo mediante el ajuste automático del modelo con IA. SageMaker SageMaker La IA proporciona métodos de ajuste de hiperparámetros, como la búsqueda en cuadrículas y la búsqueda bayesiana, y lanza trabajos de ajuste de hiperparámetros paralelos con una funcionalidad de parada temprana para trabajos de ajuste de hiperparámetros que no mejoran.

  • Control y ahorro de costes con instancias de Spot: si el tiempo de entrenamiento no es un problema importante, podría considerar la posibilidad de optimizar los costes de entrenamiento de modelos con instancias de Spot gestionadas. Tenga en cuenta que debe activar los puntos de control para que el entrenamiento de Spot siga recuperándose de las pausas intermitentes de los trabajos debidas a la sustitución de instancias de Spot. También puede utilizar la función de puntos de control para hacer copias de seguridad de sus modelos en caso de que termine inesperadamente su trabajo de entrenamiento. Para obtener más información, consulte los temas siguientes.

Después del entrenamiento

Tras el entrenamiento, se obtiene un artefacto del modelo final para utilizarlo en la implementación y la inferencia del modelo. Hay acciones adicionales en la fase posterior al entrenamiento, como se muestra en el siguiente diagrama.

Un diagrama de flujo que muestra las tareas posteriores al entrenamiento y las características de IA asociadas SageMaker
  • Obtenga el modelo de referencia: una vez que tenga el artefacto del modelo, puede configurarlo como modelo de referencia. Tenga en cuenta las siguientes acciones posteriores al entrenamiento y el uso de las funciones de SageMaker IA antes de pasar del despliegue del modelo a la producción.

  • Examine el rendimiento del modelo y compruebe si hay sesgos: utilice Amazon CloudWatch Metrics y SageMaker Clarify para detectar el sesgo posterior al entrenamiento para detectar cualquier sesgo en los datos entrantes y modelar a lo largo del tiempo en comparación con la línea base. Debe evaluar sus nuevos datos y modelar las predicciones comparándolos con los nuevos datos de forma regular o en tiempo real. Con estas funciones, puede recibir alertas sobre cualquier cambio o anomalía aguda, así como sobre cambios o desviaciones graduales en los datos y el modelo.

  • También puede utilizar la funcionalidad de entrenamiento incremental de la SageMaker IA para cargar y actualizar su modelo (o ajustarlo) con un conjunto de datos ampliado.

  • Puedes registrar el entrenamiento con modelos como parte de tu cartera de SageMaker IA o como parte de otras funciones de flujo de trabajo que ofrece la SageMaker IA para organizar todo el ciclo de vida del aprendizaje automático.

PrivacidadTérminos del sitioPreferencias de cookies
© 2025, Amazon Web Services, Inc o sus afiliados. Todos los derechos reservados.