Programación de sus flujos de trabajo de ML - Amazon SageMaker AI

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Programación de sus flujos de trabajo de ML

Con Amazon SageMaker AI, puede administrar todo su flujo de trabajo de aprendizaje automático a medida que crea conjuntos de datos, realiza transformaciones de datos, crea modelos a partir de datos e implementa sus modelos en puntos finales para realizar inferencias. Si realiza algún subconjunto de pasos de su flujo de trabajo de forma periódica, también puede optar por ejecutar estos pasos de forma programada. Por ejemplo, es posible que desee programar un trabajo en SageMaker Canvas para ejecutar una transformación de datos nuevos cada hora. En otro escenario, puede programar un trabajo semanal para supervisar la desviación del modelo implementado. Puede especificar una programación periódica en cualquier intervalo de tiempo: puede repetirlo cada segundo, minuto, día, semana, mes o el tercer viernes de cada mes a las 15:00 h.

En los siguientes escenarios, se resumen las opciones disponibles en función de su caso de uso.
  • Caso de uso 1: cree y programe su flujo de trabajo de ML en un entorno sin código. Tanto para los principiantes como para los principiantes en la SageMaker IA, puede utilizar Amazon SageMaker Canvas tanto para crear su flujo de trabajo de aprendizaje automático como para crear ejecuciones programadas mediante el programador basado en la interfaz de usuario de Canvas.

  • Caso de uso 2: cree su flujo de trabajo en un solo cuaderno de Jupyter y utilice un programador sin código. Los profesionales con experiencia en ML pueden usar código para crear su flujo de trabajo de ML en un cuaderno de Jupyter y utilizar la opción de programación sin código disponible en el widget Trabajos de cuaderno. Si su flujo de trabajo de ML consta de varios cuadernos de Jupyter, puede usar la característica de programación del Python SDK de Canalizaciones que se describe en el caso de uso 3.

  • Caso de uso 3: cree y programe su flujo de trabajo de ML con Canalizaciones. Los usuarios avanzados pueden usar el SDK de Amazon SageMaker Python o las opciones de EventBridge programación de Amazon disponibles en Pipelines. Puede crear un flujo de trabajo de aprendizaje automático compuesto por pasos que incluyan operaciones con diversas funciones y AWS servicios de SageMaker IA, como Amazon EMR.

Descriptor Caso de uso 1 Caso de uso 2 Caso de uso 3
SageMaker Función de IA Procesamiento de datos y programación del flujo de trabajo de aprendizaje automático de Amazon SageMaker Canvas Widget de programación de trabajos de cuaderno (IU) Opciones de programación del Python SDK de Canalizaciones
Descripción Con Amazon SageMaker Canvas, puede programar ejecuciones automáticas de los pasos de procesamiento de datos y, en un procedimiento independiente, actualizaciones automáticas del conjunto de datos. También puede programar de forma indirecta todo su flujo de trabajo de ML mediante una configuración que ejecute una predicción por lotes cada vez que se actualice un conjunto de datos específico. Tanto para el procesamiento automatizado de datos como para las actualizaciones de los conjuntos de datos, SageMaker Canvas proporciona un formulario básico en el que puede seleccionar una fecha y hora de inicio y un intervalo de tiempo entre las ejecuciones (o una expresión cron si programa un paso de procesamiento de datos). Para obtener más información acerca de cómo programar los pasos de procesamiento de datos, consulte Creación de una programación para procesar automáticamente los datos nuevos. Para obtener más información acerca de cómo programar actualizaciones de predicción de lotes y conjuntos de datos, consulte ¿Cómo administrar las automatizaciones. Si ha creado su flujo de trabajo de procesamiento de datos y canalización en un solo cuaderno de Jupyter, puede utilizar el widget Trabajos de cuaderno para ejecutar el cuaderno bajo demanda o de forma programada. El widget Trabajos de cuaderno muestra un formulario básico en el que puede especificar el tipo de procesamiento, la programación de ejecución y la configuración personalizada opcional. La programación de ejecución se define seleccionando un intervalo temporal o insertando una expresión cron. El widget se instala automáticamente en Studio, o puede realizar una instalación adicional para utilizar esta función en su JupyterLab entorno local. Para obtener más información acerca de los trabajos de cuadernos, consulte SageMaker Trabajos de cuaderno. Puedes usar las funciones de programación del SDK de SageMaker IA si implementaste tu flujo de trabajo de aprendizaje automático con Pipelines. Su canalización puede incluir pasos como el afinamiento, el procesamiento de datos y la implementación. Canalizaciones admite dos formas de programar la canalización. Puedes crear una EventBridge regla de Amazon o usar el PipelineScheduleconstructor SageMaker AI SDK para definir un cronograma. Para obtener más información sobre las opciones de programación disponibles en Canalizaciones, consulte Programación de ejecuciones de canalizaciones.
Optimizado para Proporciona una opción de programación para un flujo de trabajo de SageMaker Canvas ML Proporciona una opción de programación basada en la interfaz de usuario para los flujos de trabajo de ML basados en el cuaderno de Jupyter Proporciona un SDK de SageMaker IA o una opción EventBridge de programación para flujos de trabajo de aprendizaje automático
Consideraciones Puede programar su flujo de trabajo con el marco sin código de Canvas, pero las actualizaciones de conjuntos de datos y las actualizaciones de transformaciones por lotes pueden gestionar un máximo de 5 GB de datos. Puede programar un cuaderno mediante el formulario de programación basado en la interfaz de usuario, pero no varios cuadernos, en el mismo trabajo. Para programar varios cuadernos, use la solución basada en código del SDK de Canalizaciones que se describe en el caso de uso 3. Puede usar las funciones de programación más avanzadas (basadas en SDK) que ofrece Canalizaciones, pero debe consultar la documentación de la API para especificar las opciones correctas en lugar de seleccionarlas en un menú de opciones basado en la interfaz de usuario.
Entorno recomendado Amazon SageMaker Lienzo Estudio, JupyterLab entorno local Estudio, JupyterLab entorno local, cualquier editor de código

Recursos adicionales

SageMaker AI ofrece las siguientes opciones adicionales para programar tus flujos de trabajo.