Entrena a un modelo con Amazon SageMaker - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Entrena a un modelo con Amazon SageMaker

Amazon SageMaker Training es un servicio de aprendizaje automático (ML) totalmente gestionado que ofrece y SageMaker que le ayuda a entrenar de manera eficiente una amplia gama de modelos de aprendizaje automático a escala. El núcleo de sus SageMaker tareas es la contenedorización de las cargas de trabajo de aprendizaje automático y la capacidad de gestionar AWS los recursos informáticos. La plataforma de SageMaker formación se encarga del trabajo pesado asociado a la configuración y la gestión de la infraestructura para las cargas de trabajo de formación en aprendizaje automático. Con SageMaker Training, puede centrarse en desarrollar, capacitar y ajustar su modelo. Esta página presenta tres formas recomendadas para empezar a entrenar un modelo SageMaker, seguidas de opciones adicionales que puede considerar.

sugerencia

Para obtener información sobre la formación de modelos básicos para la IA generativa, consulte Uso de SageMaker JumpStart modelos básicos en Amazon SageMaker Studio.

Cómo elegir una función en Amazon SageMaker Training

Existen tres casos de uso principales para entrenar modelos de aprendizaje automático SageMaker. En esta sección se describen esos casos de uso, así como las SageMaker funciones que recomendamos para cada caso de uso.

Ya sea que esté entrenando modelos complejos de aprendizaje profundo o implementando algoritmos de aprendizaje automático más pequeños, SageMaker Training proporciona soluciones optimizadas y rentables que cumplen con los requisitos de sus casos de uso.

Casos de uso

Los siguientes son los principales casos de uso para entrenar modelos de aprendizaje automático. SageMaker

  • Caso de uso 1: Desarrolle un modelo de aprendizaje automático en un entorno de código bajo o sin código.

  • Caso de uso 2: utilice el código para desarrollar modelos de aprendizaje automático con más flexibilidad y control.

  • Caso de uso 3: desarrolle modelos de aprendizaje automático a escala con la máxima flexibilidad y control.

La siguiente tabla describe tres escenarios comunes de entrenamiento de modelos de aprendizaje automático y las opciones correspondientes para empezar con el SageMaker entrenamiento.

Caso de uso 1 Caso de uso 2 Caso de uso 3
SageMaker característica Cree un modelo con Amazon SageMaker Canvas. Entrene un modelo con uno de los algoritmos de SageMaker aprendizaje automático integrados, como XGBoost o modelos específicos de tareas, con SageMaker JumpStart el SDK de Python. SageMaker Entrene un modelo a escala con la máxima flexibilidad, aprovechando el modo script o los contenedores personalizados incluidos. SageMaker
Descripción Traiga sus datos. SageMaker ayuda a gestionar la creación de modelos de aprendizaje automático y la configuración de la infraestructura y los recursos de formación.

Traiga sus datos y elija uno de los algoritmos de aprendizaje automático integrados que proporciona SageMaker. Configure los hiperparámetros del modelo, las métricas de salida y la configuración básica de la infraestructura mediante el SDK de SageMaker Python. La plataforma SageMaker de formación ayuda a aprovisionar la infraestructura y los recursos de formación.

Desarrolle su propio código de aprendizaje automático e introdúzcalo como un script o un conjunto de scripts SageMaker. Para obtener más información, consulte Computación distribuida con prácticas SageMaker recomendadas. Además, puede traer su propio contenedor Docker. La plataforma de SageMaker formación ayuda a aprovisionar la infraestructura y los recursos de formación a escala en función de su configuración personalizada.

Optimizado para

Desarrollo de modelos con poco o sin código y basado en la interfaz de usuario con una rápida experimentación con un conjunto de datos de entrenamiento. Cuando crea un modelo personalizado, un algoritmo se selecciona automáticamente en función de sus datos. Para ver opciones de personalización avanzadas, como la selección de algoritmos, consulte Configuraciones avanzadas de creación de modelos.

Entrene modelos de aprendizaje automático con una personalización de alto nivel para los hiperparámetros y la configuración de la infraestructura y la capacidad de utilizar directamente marcos de aprendizaje automático y scripts de punto de entrada para lograr una mayor flexibilidad. Utilice algoritmos integrados, modelos previamente entrenados y JumpStart modelos a través del SDK de Amazon SageMaker Python para desarrollar modelos de aprendizaje automático. Para obtener más información, consulte Implementación de código bajo con la JumpStart clase.

Cargas de trabajo de formación en aprendizaje automático a escala, que requieren múltiples instancias y la máxima flexibilidad. Vea la informática distribuida con las SageMaker mejores prácticas. SageMaker utiliza imágenes de Docker para alojar la formación y el servicio de todos los modelos. Puede usar cualquier algoritmo SageMaker o algoritmos externos y usar contenedores Docker para crear modelos.

Consideraciones

Flexibilidad mínima para personalizar el modelo proporcionado por Amazon SageMaker Canvas.

El SDK de SageMaker Python proporciona una interfaz simplificada y menos opciones de configuración en comparación con la API de SageMaker entrenamiento de bajo nivel.

Requiere conocimientos sobre la AWS infraestructura y las opciones de formación distribuida. Consulte también Cree su propio contenedor de formación con el kit de herramientas de SageMaker formación.

Entorno recomendado Usa Amazon SageMaker Canvas. Para obtener información sobre cómo configurarlo, consulte Cómo empezar a usar SageMaker Canvas. SageMaker JupyterLabÚselo en Amazon SageMaker Studio. Para obtener información sobre cómo configurarlo, consulte Launch Amazon SageMaker Studio. SageMaker JupyterLabÚselo en Amazon SageMaker Studio. Para obtener información sobre cómo configurarlo, consulte Launch Amazon SageMaker Studio.

Opciones adicionales

SageMaker ofrece las siguientes opciones adicionales para entrenar modelos de aprendizaje automático.

SageMaker funciones que ofrecen capacidades de formación

  • SageMaker JumpStart: SageMaker JumpStart proporciona acceso al centro de modelos SageMaker público que contiene los últimos modelos básicos (FM) patentados y disponibles públicamente. Puede ajustar, evaluar e implementar estos modelos en Amazon SageMaker Studio. SageMaker JumpStart agiliza el proceso de aprovechar los modelos básicos para sus casos de uso generativos de la IA y le permite crear centros de modelos privados para utilizar los modelos básicos, al tiempo que impone barreras de gobierno y garantiza que su organización solo pueda acceder a los modelos aprobados. Para empezar, consulte los modelos básicos. SageMaker JumpStart SageMaker JumpStart

  • SageMaker HyperPod: SageMaker HyperPod es un servicio de clústeres persistente para casos de uso que necesitan clústeres resilientes para cargas de trabajo masivas de aprendizaje automático (ML) y para desarrollar state-of-the-art modelos básicos (FM). Acelera el desarrollo de estos modelos al eliminar el trabajo pesado indiferenciado que implica la creación y el mantenimiento de clústeres de cómputo a gran escala alimentados por miles de aceleradores, como AWS Trainium o las unidades de procesamiento gráfico (GPU) NVIDIA A100 y H100. Puede utilizar un software de gestión de carga de trabajo como Slurm on. HyperPod

Más funciones de Training SageMaker

  • Ajuste de hiperparámetros: esta SageMaker función ayuda a definir un conjunto de hiperparámetros para un modelo y a lanzar muchos trabajos de entrenamiento en un conjunto de datos. En función de los valores de los hiperparámetros, el rendimiento del entrenamiento del modelo puede variar. Esta función proporciona el conjunto de hiperparámetros con mejor rendimiento dentro del rango determinado de hiperparámetros por los que ha configurado la búsqueda.

  • Capacitación distribuida: capacite previamente o ajuste con precisión a las máquinas virtuales creadas con NVIDIA CUDA y otros PyTorch marcos basados en ellos. PyTorch Para utilizar las instancias de GPU de forma eficiente, utilice las bibliotecas de formación SageMaker distribuidas que ofrecen operaciones de comunicación colectivas y diversas técnicas de paralelismo de modelos, como el paralelismo experto y el paralelismo de datos compartidos, que están optimizadas para la infraestructura. AWS

  • Características de observabilidad: utilice las funcionalidades de creación de perfiles y depuración de Training para obtener información sobre las cargas de trabajo de SageMaker entrenamiento de modelos, el rendimiento de los modelos y la utilización de los recursos. Para obtener más información, consulte Depurar y mejorar el rendimiento del modelo y Profile y optimizar el rendimiento computacional.

  • Opciones de instancias eficientes y que ahorran costes: para optimizar el coste informático y la eficiencia a la hora de entrenar el aprovisionamiento de instancias, utilice clústeres heterogéneos, instancias puntuales gestionadas o pools de almacenamiento gestionados.