Cree un cronograma para procesar automáticamente los nuevos datos - Amazon SageMaker

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Cree un cronograma para procesar automáticamente los nuevos datos

nota

La siguiente sección solo se aplica a los trabajos SageMaker de procesamiento. Si usó la configuración predeterminada de Canvas o EMR Serverless para crear un trabajo remoto para aplicar transformaciones a todo su conjunto de datos, esta sección no se aplica.

Si procesa datos periódicamente, puede crear una programación para ejecutar el trabajo de procesamiento de forma automática. Por ejemplo, puede crear una programación que ejecute un trabajo de procesamiento automáticamente cuando obtenga datos nuevos. Para obtener más información sobre los trabajos de procesamiento, consulteExportar a Amazon S3..

Al crear un trabajo, debe especificar un IAM rol que tenga permisos para crear el trabajo. Puede usar la AmazonSageMakerCanvasDataPrepFullAccesspolítica para añadir permisos.

Agregue la siguiente política de confianza al rol EventBridge para poder asumirlo.

{ "Effect": "Allow", "Principal": { "Service": "events.amazonaws.com" }, "Action": "sts:AssumeRole" }
importante

Al crear una programación, Data Wrangler crea una eventRule entrada. EventBridge Se le cobrará tanto por las reglas de eventos que cree como por las instancias que utilice para ejecutar el trabajo de procesamiento.

Para obtener información sobre EventBridge los precios, consulta los EventBridge precios de Amazon. Para obtener información sobre cómo procesar los precios de los trabajos, consulta Amazon SageMaker Pricing.

Utilice uno de los métodos siguientes para definir una programación:

  • CRONexpresiones

    nota

    Data Wrangler no admite las siguientes expresiones:

    • LW#

    • Abreviaturas para días

    • Abreviaturas para días

  • RATEexpresiones

  • Recurrente: establece un intervalo de una hora o un día para ejecutar el trabajo.

  • Hora específica: establece días y horas concretos para ejecutar el trabajo.

En las siguientes secciones se describen los procedimientos para programar tareas al rellenar la configuración de SageMaker procesamiento de tareas al exportar los datos a Amazon S3. Todas las instrucciones siguientes comienzan en la sección Asociar horarios de la configuración de los trabajos de SageMaker procesamiento.

CRON

Utilice el siguiente procedimiento para crear una programación con una CRON expresión.

  1. En el panel lateral Exportar a Amazon S3, asegúrese de haber desactivado la opción Configuración automática de tareas y de haber seleccionado la opción SageMaker Procesamiento.

  2. En la configuración del trabajo de SageMaker procesamiento, abre la sección Asociar cronogramas y selecciona Crear un nuevo cronograma.

  3. Se abre el cuadro de diálogo Crear una nueva programación. En Nombre de la programación, especifique el nombre de la programación.

  4. En Frecuencia de ejecución, elija CRON.

  5. Introduzca valores de CRON expresión válidos para cada uno de los campos Minutos, Horas, Días del mes, Mes y Día de la semana.

  6. Seleccione Crear.

  7. De forma opcional, elija Agregar otra programación para ejecutar el trabajo según una programación adicional.

    nota

    Puede asociar un máximo de dos programaciones. Las programaciones son independientes y no se afectan entre sí a menos que los horarios se superpongan.

  8. Seleccione una de las siguientes opciones:

    • Programe y ejecute ahora: el trabajo se ejecuta inmediatamente y, posteriormente, se ejecuta según lo programado.

    • Solo programar: el trabajo solo se ejecuta según los horarios que especifique.

  9. Elija Exportar después de haber rellenado el resto de la configuración del trabajo de exportación.

RATE

Utilice el siguiente procedimiento para crear una programación con una RATE expresión.

  1. En el panel lateral Exportar a Amazon S3, asegúrese de haber desactivado la opción Configuración automática de tareas y de haber seleccionado la opción SageMaker Procesamiento.

  2. En la configuración del trabajo de SageMaker procesamiento, abre la sección Asociar cronogramas y selecciona Crear un nuevo cronograma.

  3. Se abre el cuadro de diálogo Crear una nueva programación. En Nombre de la programación, especifique el nombre de la programación.

  4. En Frecuencia de ejecución, elija Velocidad.

  5. En Valor, especifique un valor entero.

  6. En Unidad, seleccione una de las opciones siguientes:

    • Minutos

    • Horas

    • Días

  7. Seleccione Crear.

  8. De forma opcional, elija Agregar otra programación para ejecutar el trabajo según una programación adicional.

    nota

    Puede asociar un máximo de dos programaciones. Las programaciones son independientes y no se afectan entre sí a menos que los horarios se superpongan.

  9. Seleccione una de las siguientes opciones:

    • Programe y ejecute ahora: el trabajo se ejecuta inmediatamente y, posteriormente, se ejecuta según lo programado.

    • Solo programar: el trabajo solo se ejecuta según los horarios que especifique.

  10. Elija Exportar después de haber rellenado el resto de la configuración del trabajo de exportación.

Recurring

Utilice el siguiente procedimiento para crear un programa que ejecute un trabajo de forma recurrente.

  1. En el panel lateral Exportar a Amazon S3, asegúrese de haber desactivado la opción Configuración automática de tareas y de haber seleccionado la opción SageMaker Procesamiento.

  2. En la configuración del trabajo de SageMaker procesamiento, abre la sección Asociar cronogramas y selecciona Crear un nuevo cronograma.

  3. Se abre el cuadro de diálogo Crear una nueva programación. En Nombre de la programación, especifique el nombre de la programación.

  4. En Frecuencia de ejecución, elija Recurrente.

  5. En Cada x horas, especifique la frecuencia horaria con la que se ejecuta el trabajo durante el día. Los valores válidos son enteros en el rango inclusivo de 1 a23.

  6. Para En días, seleccione una de las siguientes opciones:

    • Todos los días

    • Fines de semana

    • Días laborales

    • Seleccionar días

    1. De forma opcional, si eligió Seleccionar días, elija los días de la semana en los que se ejecutará el trabajo.

    nota

    El horario se restablece cada día. Si programa un trabajo para que se ejecute cada cinco horas, se ejecutará en los siguientes momentos del día:

    • 00:00

    • 05:00

    • 10:00

    • 15:00

    • 20:00

  7. Seleccione Crear.

  8. De forma opcional, elija Agregar otra programación para ejecutar el trabajo según una programación adicional.

    nota

    Puede asociar un máximo de dos programaciones. Las programaciones son independientes y no se afectan entre sí a menos que los horarios se superpongan.

  9. Seleccione una de las siguientes opciones:

    • Programe y ejecute ahora: el trabajo se ejecuta inmediatamente y, posteriormente, se ejecuta según lo programado.

    • Solo programar: el trabajo solo se ejecuta según los horarios que especifique.

  10. Elija Exportar después de haber rellenado el resto de la configuración del trabajo de exportación.

Specific time

Utilice el siguiente procedimiento para crear una programación que ejecute un trabajo en momentos concretos.

  1. En el panel lateral Exportar a Amazon S3, asegúrese de haber desactivado la opción Configuración automática de tareas y de haber seleccionado la opción SageMaker Procesamiento.

  2. En la configuración del trabajo de SageMaker procesamiento, abre la sección Asociar cronogramas y selecciona Crear un nuevo cronograma.

  3. Se abre el cuadro de diálogo Crear una nueva programación. En Nombre de la programación, especifique el nombre de la programación.

  4. En Frecuencia de ejecución, seleccione Hora de inicio.

  5. En Hora de inicio, introduzca una hora en UTC formato (por ejemplo,09:00). La hora de inicio se establece de forma predeterminada en la zona horaria en la que se encuentra.

  6. Para En días, seleccione una de las siguientes opciones:

    • Todos los días

    • Fines de semana

    • Días laborales

    • Seleccionar días

    1. De forma opcional, si eligió Seleccionar días, elija los días de la semana en los que se ejecutará el trabajo.

  7. Seleccione Crear.

  8. De forma opcional, elija Agregar otra programación para ejecutar el trabajo según una programación adicional.

    nota

    Puede asociar un máximo de dos programaciones. Las programaciones son independientes y no se afectan entre sí a menos que los horarios se superpongan.

  9. Seleccione una de las siguientes opciones:

    • Programe y ejecute ahora: el trabajo se ejecuta inmediatamente y, posteriormente, se ejecuta según lo programado.

    • Solo programar: el trabajo solo se ejecuta según los horarios que especifique.

  10. Elija Exportar después de haber rellenado el resto de la configuración del trabajo de exportación.

Puede utilizarla SageMaker AWS Management Console para ver los trabajos que están programados para ejecutarse. Sus trabajos de procesamiento se ejecutan dentro de Pipelines. Cada trabajo de procesamiento tiene su propia canalización. Se ejecuta como un paso de procesamiento dentro de la canalización. Puede ver las programaciones que ha creado dentro de una canalización. Para obtener información acerca de cómo visualizar una canalización, consulte Vea los detalles de una canalización.

Utilice el siguiente procedimiento para ver los trabajos que ha programado.

Para ver los trabajos que ha programado, haga lo siguiente.

  1. Abre Amazon SageMaker Studio Classic.

  2. Abra Pipelines

  3. Vea las canalizaciones de los trabajos que ha creado.

    La canalización que ejecuta el trabajo usa el nombre del trabajo como prefijo. Por ejemplo, si ha creado un trabajo denominado housing-data-feature-enginnering, el nombre de la canalización es canvas-data-prep-housing-data-feature-engineering.

  4. Elija la canalización que contiene su trabajo.

  5. Vea el estado de las canalizaciones. Las canalizaciones con un Estado Correcto han ejecutado el trabajo de procesamiento correctamente.

Para detener la ejecución del trabajo de procesamiento, haga lo siguiente:

Para detener la ejecución de un trabajo de procesamiento, elimine la regla de eventos que especifica la programación. Al eliminar una regla de eventos, se detiene la ejecución de todos los trabajos asociados a la programación. Para obtener información sobre cómo eliminar una regla, consulta Cómo deshabilitar o eliminar una EventBridge regla de Amazon.

También puede detener y eliminar las canalizaciones asociadas a las programaciones. Para obtener información sobre cómo detener una canalización, consulta StopPipelineExecution. Para obtener información sobre la eliminación de una canalización, consulte DeletePipeline.