Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
SageMaker Piloto automático
importante
A partir del 30 de noviembre de 2023, la interfaz de usuario de Autopilot migrará a Amazon SageMaker Canvas como parte de la experiencia actualizada de Amazon SageMaker Studio. SageMaker Canvas proporciona a los analistas y científicos de datos ciudadanos funciones sin necesidad de programar para tareas como la preparación de datos, la ingeniería de funciones, la selección de algoritmos, la formación y el ajuste, la inferencia y mucho más. Los usuarios pueden aprovechar las visualizaciones integradas y el análisis hipotético para explorar sus datos y diferentes escenarios, con predicciones automatizadas que les permiten producir fácilmente sus modelos. Canvas admite una variedad de casos de uso, como la visión artificial, la previsión de la demanda, la búsqueda inteligente y la IA generativa.
Los usuarios de Amazon SageMaker Studio Classic, la experiencia anterior de Studio, pueden seguir utilizando la interfaz de usuario del piloto automático en Studio Classic. Los usuarios con experiencia en programación pueden seguir utilizando todas APIlas referencias de cualquier aplicación técnica compatibleSDK.
Si ha utilizado el piloto automático en Studio Classic hasta ahora y quiere migrar a SageMaker Canvas, es posible que tenga que conceder permisos adicionales a su perfil de usuario o IAM función para poder crear y utilizar la aplicación SageMaker Canvas. Para obtener más información, consulte (Opcional) Migre del piloto automático de Studio Classic a Canvas SageMaker .
Todas las instrucciones relacionadas con la interfaz de usuario de esta guía se refieren a las funciones independientes de Autopilot antes de migrar a Amazon Canvas. SageMaker Los usuarios que sigan estas instrucciones deben usar Studio Classic.
Amazon SageMaker Autopilot es un conjunto de funciones que simplifica y acelera varias etapas del flujo de trabajo de aprendizaje automático al automatizar el proceso de creación e implementación de modelos de aprendizaje automático (AutoML). En la siguiente página se explica la información clave sobre Amazon SageMaker Autopilot.
El piloto automático realiza las siguientes tareas clave que puede utilizar en piloto automático o con distintos grados de orientación humana:
-
Análisis y preprocesamiento de datos: Piloto automático identifica el tipo de problema específico, gestiona los valores que faltan, normaliza los datos, selecciona las características y prepara en general los datos para el entrenamiento del modelo.
-
Selección del modelo: Piloto automático explora una variedad de algoritmos y utiliza una técnica de remuestreo con validación cruzada para generar métricas que evalúen la calidad predictiva de los algoritmos en función de métricas objetivas predefinidas.
-
Optimización de hiperparámetros: el piloto automático automatiza la búsqueda de configuraciones de hiperparámetros óptimas.
-
Capacitación y evaluación de modelos: el piloto automático automatiza el proceso de entrenamiento y evaluación de varios modelos candidatos. Divide los datos en conjuntos de entrenamiento y validación, entrena a los candidatos a modelo seleccionados utilizando los datos de entrenamiento y evalúa el rendimiento sobre los datos no observados del conjunto de validación. Por último, clasifica los candidatos a modelo optimizados en función de su rendimiento e identifica el modelo con mejor rendimiento.
-
Implementación del modelo: una vez que el piloto automático ha identificado el modelo con mejor rendimiento, ofrece la opción de implementar el modelo automáticamente generando los artefactos del modelo y el punto final, exponiendo un. API Las aplicaciones externas pueden enviar datos al punto de conexión y recibir las predicciones o inferencias correspondientes.
El piloto automático permite crear modelos de aprendizaje automático en grandes conjuntos de datos de hasta cientos de. GBs
El siguiente diagrama describe las tareas de este proceso de AutoML gestionado por Autopilot.
En función de su nivel de comodidad con el proceso de machine learning y de su experiencia en programación, puede utilizar Piloto automático de diferentes maneras:
-
Con la interfaz de usuario clásica de Studio, los usuarios pueden elegir entre una experiencia sin código o contar con cierto nivel de intervención humana.
nota
En la interfaz de usuario de Studio Classic, solo están disponibles los experimentos creados a partir de datos tabulares para tipos de problemas como la regresión o la clasificación.
-
Con el AutoML API, los usuarios con experiencia en codificación pueden utilizar los disponibles SDKs para crear trabajos de AutoML. Este enfoque proporciona una mayor flexibilidad y opciones de personalización y está disponible para todos los tipos de problemas.
Actualmente, Autopilot es compatible con los siguientes tipos de problemas:
nota
Para los problemas de regresión o clasificación relacionados con datos tabulares, los usuarios pueden elegir entre dos opciones: utilizar la interfaz de usuario de Studio Classic o la APIReference.
Tareas como la clasificación de textos e imágenes, la previsión de series temporales y el ajuste de modelos lingüísticos de gran tamaño están disponibles exclusivamente a través de la versión 2 del AutoML. REST API Si su idioma preferido es Python, puede hacer AWS SDK for Python (Boto3)
Los usuarios que prefieran la comodidad de una interfaz de usuario pueden usar Amazon SageMaker Canvas para acceder a modelos previamente entrenados y modelos básicos de IA generativa, o crear modelos personalizados adaptados a textos específicos, clasificación de imágenes, necesidades de previsión o IA generativa.
-
Clasificación por regresión, binaria y multiclase con datos tabulares formateados como CSV archivos Parquet en los que cada columna contiene una entidad con un tipo de datos específico y cada fila contiene una observación. Algunos tipos de datos de columna aceptados son series numéricas, categóricas, de texto y temporales compuestas por cadenas de números separados por comas.
-
Para crear un trabajo de piloto automático como experimento piloto utilizando la referencia, consulte. SageMaker API Cree trabajos de regresión o clasificación para datos tabulares mediante el AutoML API
-
Para crear un trabajo de piloto automático como experimento piloto mediante la interfaz de usuario de Studio Classic, consulte. Cree un experimento de piloto automático de regresión o clasificación para datos tabulares mediante la interfaz de usuario clásica de Studio
-
Si es administrador y desea preconfigurar los parámetros predeterminados de infraestructura, red o seguridad de los experimentos de piloto automático en la interfaz de usuario de Studio Classic, consulte. Configurar los parámetros predeterminados de un experimento de Piloto automático (para administradores)
-
-
Clasificación de texto con datos CSV formateados como archivos Parquet en los que una columna contiene las frases que se van a clasificar y otra columna debe incluir la etiqueta de clase correspondiente. Consulte Cree un trabajo de AutoML para la clasificación de texto mediante el API.
-
Clasificación de imágenes con formatos de imagen como PNGJPEG, o una combinación de ambosCree un trabajo de clasificación de imágenes con el AutoML API. Consulte.
-
Previsión de series temporales con datos de series temporales formateados como archivos Parquet. Consulte. CSV Cree un trabajo de AutoML para la previsión de series temporales mediante el API
-
Ajuste preciso de modelos lingüísticos de gran tamaño (LLMs) para la generación de texto con datos formateados como archivos Parquet. Consulte. CSV Cree un trabajo de AutoML para ajustar con precisión los modelos de generación de texto mediante API
Además, Piloto automático ayuda a los usuarios a entender cómo hacen predicciones los modelos mediante la generación automática de informes que muestran la importancia de cada característica individual. Esto proporciona transparencia e información sobre los factores que influyen en las predicciones, algo que pueden utilizar los equipos de riesgo y cumplimiento y los reguladores externos. Piloto automático también proporciona un informe de rendimiento del modelo, que incluye un resumen de las métricas de evaluación, una matriz de confusión, diversas visualizaciones, como las curvas características del funcionamiento del receptor y las curvas de recuperación de precisión, etc. El contenido específico de cada informe varía según el tipo de problema del experimento con Piloto automático.
Los informes de explicabilidad y rendimiento del mejor modelo candidato para un experimento de piloto automático están disponibles para tipos de problemas de clasificación de datos tabulares, de imágenes y de texto.
Para los casos de uso de datos tabulares, como la regresión o la clasificación, el piloto automático ofrece una visibilidad adicional sobre cómo se clasificaron los datos y cómo se seleccionaron, entrenaron y ajustaron los modelos candidatos mediante la generación de cuadernos que contienen el código utilizado para explorar los datos y encontrar el modelo con el mejor rendimiento. Estos cuadernos proporcionan un entorno interactivo y exploratorio que le ayuda a conocer el impacto de las distintas entradas, o las ventajas y desventajas que se obtienen en los experimentos. Puede seguir experimentando con el modelo candidato de mayor rendimiento mediante sus propias modificaciones en los cuadernos de exploración de datos y de definición de candidatos proporcionados por Autopilot.
Con Amazon SageMaker, solo pagas por lo que usas. Usted paga por los recursos informáticos y de almacenamiento subyacentes incluidos en SageMaker los demás AWS servicios, en función del uso que haga. Para obtener más información sobre el coste de uso SageMaker, consulta los SageMakerprecios de Amazon
Temas
- Cree trabajos de regresión o clasificación para datos tabulares mediante el AutoML API
- Cree un trabajo de clasificación de imágenes con el AutoML API
- Cree un trabajo de AutoML para la clasificación de texto mediante el API
- Cree un trabajo de AutoML para la previsión de series temporales mediante el API
- Cree un trabajo de AutoML para ajustar con precisión los modelos de generación de texto mediante API
- Cree un experimento de piloto automático de regresión o clasificación para datos tabulares mediante la interfaz de usuario clásica de Studio
- Ejemplos de SageMaker cuadernos Amazon Autopilot
- Vídeos: Uso de Piloto automático para automatizar y explorar el proceso de machine learning
- Tutoriales: Cómo empezar a usar Amazon SageMaker Autopilot
- Cuotas de piloto automático
- APIGuía de referencia para Autopilot