Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Programación de sus flujos de trabajo de ML
Con Amazon SageMaker AI, puede administrar todo su flujo de trabajo de aprendizaje automático a medida que crea conjuntos de datos, realiza transformaciones de datos, crea modelos a partir de datos e implementa sus modelos en puntos finales para realizar inferencias. Si realiza algún subconjunto de pasos de su flujo de trabajo de forma periódica, también puede optar por ejecutar estos pasos de forma programada. Por ejemplo, es posible que desee programar un trabajo en SageMaker Canvas para ejecutar una transformación de datos nuevos cada hora. En otro escenario, puede programar un trabajo semanal para supervisar la desviación del modelo implementado. Puede especificar una programación periódica en cualquier intervalo de tiempo: puede repetirlo cada segundo, minuto, día, semana, mes o el tercer viernes de cada mes a las 15:00 h.
En los siguientes escenarios, se resumen las opciones disponibles en función de su caso de uso.
Caso de uso 1: cree y programe su flujo de trabajo de ML en un entorno sin código. Tanto para los principiantes como para los principiantes en la SageMaker IA, puede utilizar Amazon SageMaker Canvas tanto para crear su flujo de trabajo de aprendizaje automático como para crear ejecuciones programadas mediante el programador basado en la interfaz de usuario de Canvas.
Caso de uso 2: cree su flujo de trabajo en un solo cuaderno de Jupyter y utilice un programador sin código. Los profesionales con experiencia en ML pueden usar código para crear su flujo de trabajo de ML en un cuaderno de Jupyter y utilizar la opción de programación sin código disponible en el widget Trabajos de cuaderno. Si su flujo de trabajo de ML consta de varios cuadernos de Jupyter, puede usar la característica de programación del Python SDK de Canalizaciones que se describe en el caso de uso 3.
Caso de uso 3: cree y programe su flujo de trabajo de ML con Canalizaciones. Los usuarios avanzados pueden usar el SDK de Amazon SageMaker Python
o las opciones de EventBridge programación de Amazon disponibles en Pipelines. Puede crear un flujo de trabajo de aprendizaje automático compuesto por pasos que incluyan operaciones con diversas funciones y AWS servicios de SageMaker IA, como Amazon EMR.
Descriptor | Caso de uso 1 | Caso de uso 2 | Caso de uso 3 |
---|---|---|---|
SageMaker Función de IA | Procesamiento de datos y programación del flujo de trabajo de aprendizaje automático de Amazon SageMaker Canvas | Widget de programación de trabajos de cuaderno (IU) | Opciones de programación del Python SDK de Canalizaciones |
Descripción | Con Amazon SageMaker Canvas, puede programar ejecuciones automáticas de los pasos de procesamiento de datos y, en un procedimiento independiente, actualizaciones automáticas del conjunto de datos. También puede programar de forma indirecta todo su flujo de trabajo de ML mediante una configuración que ejecute una predicción por lotes cada vez que se actualice un conjunto de datos específico. Tanto para el procesamiento automatizado de datos como para las actualizaciones de los conjuntos de datos, SageMaker Canvas proporciona un formulario básico en el que puede seleccionar una fecha y hora de inicio y un intervalo de tiempo entre las ejecuciones (o una expresión cron si programa un paso de procesamiento de datos). Para obtener más información acerca de cómo programar los pasos de procesamiento de datos, consulte Creación de una programación para procesar automáticamente los datos nuevos. Para obtener más información acerca de cómo programar actualizaciones de predicción de lotes y conjuntos de datos, consulte ¿Cómo administrar las automatizaciones. | Si ha creado su flujo de trabajo de procesamiento de datos y canalización en un solo cuaderno de Jupyter, puede utilizar el widget Trabajos de cuaderno para ejecutar el cuaderno bajo demanda o de forma programada. El widget Trabajos de cuaderno muestra un formulario básico en el que puede especificar el tipo de procesamiento, la programación de ejecución y la configuración personalizada opcional. La programación de ejecución se define seleccionando un intervalo temporal o insertando una expresión cron. El widget se instala automáticamente en Studio, o puede realizar una instalación adicional para utilizar esta función en su JupyterLab entorno local. Para obtener más información acerca de los trabajos de cuadernos, consulte SageMaker Trabajos de cuaderno. | Puedes usar las funciones de programación del SDK de SageMaker IA si implementaste tu flujo de trabajo de aprendizaje automático con Pipelines. Su canalización puede incluir pasos como el afinamiento, el procesamiento de datos y la implementación. Canalizaciones admite dos formas de programar la canalización. Puedes crear una EventBridge regla de Amazon o usar el PipelineSchedule |
Optimizado para | Proporciona una opción de programación para un flujo de trabajo de SageMaker Canvas ML | Proporciona una opción de programación basada en la interfaz de usuario para los flujos de trabajo de ML basados en el cuaderno de Jupyter | Proporciona un SDK de SageMaker IA o una opción EventBridge de programación para flujos de trabajo de aprendizaje automático |
Consideraciones | Puede programar su flujo de trabajo con el marco sin código de Canvas, pero las actualizaciones de conjuntos de datos y las actualizaciones de transformaciones por lotes pueden gestionar un máximo de 5 GB de datos. | Puede programar un cuaderno mediante el formulario de programación basado en la interfaz de usuario, pero no varios cuadernos, en el mismo trabajo. Para programar varios cuadernos, use la solución basada en código del SDK de Canalizaciones que se describe en el caso de uso 3. | Puede usar las funciones de programación más avanzadas (basadas en SDK) que ofrece Canalizaciones, pero debe consultar la documentación de la API para especificar las opciones correctas en lugar de seleccionarlas en un menú de opciones basado en la interfaz de usuario. |
Entorno recomendado | Amazon SageMaker Lienzo | Estudio, JupyterLab entorno local | Estudio, JupyterLab entorno local, cualquier editor de código |
Recursos adicionales
SageMaker AI ofrece las siguientes opciones adicionales para programar tus flujos de trabajo.
¿Qué es Amazon EventBridge Scheduler? . Las opciones de programación analizadas en esta sección incluyen opciones prediseñadas disponibles en SageMaker Canvas, Studio y el SDK de Python para SageMaker IA. Todas las opciones amplían las funciones de Amazon EventBridge y también puedes crear tu propia solución de programación personalizada con ella EventBridge.
Ejecuciones programadas y basadas en eventos para las canalizaciones del procesador de características. Con el procesamiento de funciones de Amazon SageMaker Feature Store, puede configurar sus procesos de procesamiento de características para que se ejecuten según una programación o como resultado de otro evento de AWS servicio.