Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Creación de una programación para procesar automáticamente los datos nuevos
La siguiente sección solo se aplica a los trabajos SageMaker de procesamiento. Si usó la configuración predeterminada de Canvas o EMR Serverless para crear un trabajo remoto para aplicar transformaciones a todo su conjunto de datos, esta sección no se aplica.
Si procesa datos periódicamente, puede crear una programación para ejecutar el trabajo de procesamiento de forma automática. Por ejemplo, puede crear una programación que ejecute un trabajo de procesamiento automáticamente cuando obtenga datos nuevos. Para obtener más información acerca de los trabajos de procesamiento, consulte Exportar a Amazon S3..
Al crear un trabajo, debe especificar un IAM rol que tenga permisos para crear el trabajo. Puede usar la AmazonSageMakerCanvasDataPrepFullAccesspolítica para añadir permisos.
Agregue la siguiente política de confianza al rol EventBridge para poder asumirlo.
{
"Effect": "Allow",
"Principal": {
"Service": "events.amazonaws.com"
},
"Action": "sts:AssumeRole"
}
Al crear una programación, Data Wrangler crea una eventRule
entrada. EventBridge Se le cobrará tanto por las reglas de eventos que cree como por las instancias que utilice para ejecutar el trabajo de procesamiento.
Para obtener información sobre EventBridge los precios, consulta los EventBridge precios de Amazon. Para obtener información sobre cómo procesar los precios de los trabajos, consulta Amazon SageMaker AI Pricing.
Utilice uno de los métodos siguientes para definir una programación:
En las siguientes secciones se proporcionan procedimientos para programar trabajos al rellenar la configuración del trabajo de procesamiento de SageMaker IA al exportar los datos a Amazon S3. Todas las instrucciones siguientes comienzan en la sección Asociar horarios de la configuración del trabajo de SageMaker procesamiento.
- CRON
-
Utilice el siguiente procedimiento para crear una programación con una CRON expresión.
-
En el panel lateral Exportar a Amazon S3, asegúrese de haber desactivado la opción Configuración automática de tareas y de haber seleccionado la opción SageMaker Procesamiento.
-
En la configuración del trabajo de SageMaker procesamiento, abre la sección Asociar cronogramas y selecciona Crear un nuevo cronograma.
-
Se abre el cuadro de diálogo Crear nueva programación. En Nombre de la programación, especifique el nombre de la programación.
-
En Frecuencia de ejecución, elija CRON.
-
Introduzca valores de CRON expresión válidos para cada uno de los campos Minutos, Horas, Días del mes, Mes y Día de la semana.
-
Seleccione Crear.
-
De forma opcional, elija Agregar otra programación para ejecutar el trabajo según una programación adicional.
Puede asociar un máximo de dos programaciones. Las programaciones son independientes y no se afectan entre sí a menos que los horarios se superpongan.
-
Seleccione una de las siguientes opciones:
-
Programar y ejecutar ahora: el trabajo se ejecuta inmediatamente y, posteriormente, se ejecuta según las programaciones.
-
Solo programar: el trabajo solo se ejecuta según las programaciones que usted especifique.
-
Seleccione Exportar después de haber rellenado el resto de la configuración de trabajos de exportación.
- RATE
-
Utilice el siguiente procedimiento para crear una programación con una RATE expresión.
-
En el panel lateral Exportar a Amazon S3, asegúrese de haber desactivado la opción Configuración automática de tareas y de haber seleccionado la opción SageMaker Procesamiento.
-
En la configuración del trabajo de SageMaker procesamiento, abre la sección Asociar cronogramas y selecciona Crear un nuevo cronograma.
-
Se abre el cuadro de diálogo Crear nueva programación. En Nombre de la programación, especifique el nombre de la programación.
-
En Frecuencia de ejecución, elija Velocidad.
-
En Valor, especifique un valor entero.
-
En Unidad, seleccione una de las opciones siguientes:
-
Seleccione Crear.
-
De forma opcional, elija Agregar otra programación para ejecutar el trabajo según una programación adicional.
Puede asociar un máximo de dos programaciones. Las programaciones son independientes y no se afectan entre sí a menos que los horarios se superpongan.
-
Seleccione una de las siguientes opciones:
-
Programar y ejecutar ahora: el trabajo se ejecuta inmediatamente y, posteriormente, se ejecuta según las programaciones.
-
Solo programar: el trabajo solo se ejecuta según las programaciones que usted especifique.
-
Seleccione Exportar después de haber rellenado el resto de la configuración de trabajos de exportación.
- Recurring
-
Utilice el siguiente procedimiento para crear un programa que ejecute un trabajo de forma recurrente.
-
En el panel lateral Exportar a Amazon S3, asegúrese de haber desactivado la opción Configuración automática de tareas y de haber seleccionado la opción SageMaker Procesamiento.
-
En la configuración del trabajo de SageMaker procesamiento, abre la sección Asociar cronogramas y selecciona Crear un nuevo cronograma.
-
Se abre el cuadro de diálogo Crear nueva programación. En Nombre de la programación, especifique el nombre de la programación.
-
En Frecuencia de ejecución, seleccione Recurrente.
-
En Cada x horas, especifique la frecuencia horaria con la que se ejecuta el trabajo durante el día. Los valores válidos son enteros en el rango inclusivo de 1
a23
.
-
Para En días, seleccione una de las siguientes opciones:
-
Todos los días
-
Fines de semana
-
Días laborales
-
Seleccionar días
-
De forma opcional, si eligió Seleccionar días, elija los días de la semana en los que se ejecutará el trabajo.
El horario se restablece cada día. Si programa un trabajo para que se ejecute cada cinco horas, se ejecutará en los siguientes momentos del día:
-
00:00
-
05:00
-
10:00
-
15:00
-
20:00
-
Seleccione Crear.
-
De forma opcional, elija Agregar otra programación para ejecutar el trabajo según una programación adicional.
Puede asociar un máximo de dos programaciones. Las programaciones son independientes y no se afectan entre sí a menos que los horarios se superpongan.
-
Seleccione una de las siguientes opciones:
-
Programar y ejecutar ahora: el trabajo se ejecuta inmediatamente y, posteriormente, se ejecuta según las programaciones.
-
Solo programar: el trabajo solo se ejecuta según las programaciones que usted especifique.
-
Seleccione Exportar después de haber rellenado el resto de la configuración de trabajos de exportación.
- Specific time
-
Utilice el siguiente procedimiento para crear una programación que ejecute un trabajo en momentos concretos.
-
En el panel lateral Exportar a Amazon S3, asegúrese de haber desactivado la opción Configuración automática de tareas y de haber seleccionado la opción SageMaker Procesamiento.
-
En la configuración del trabajo de SageMaker procesamiento, abre la sección Asociar cronogramas y selecciona Crear un nuevo cronograma.
-
Se abre el cuadro de diálogo Crear nueva programación. En Nombre de la programación, especifique el nombre de la programación.
-
En Frecuencia de ejecución, seleccione Hora de inicio.
-
En Hora de inicio, introduzca una hora en UTC formato (por ejemplo,09:00
). La hora de inicio se establece de forma predeterminada en la zona horaria en la que se encuentra.
-
Para En días, seleccione una de las siguientes opciones:
-
Todos los días
-
Fines de semana
-
Días laborales
-
Seleccionar días
-
De forma opcional, si eligió Seleccionar días, elija los días de la semana en los que se ejecutará el trabajo.
-
Seleccione Crear.
-
De forma opcional, elija Agregar otra programación para ejecutar el trabajo según una programación adicional.
Puede asociar un máximo de dos programaciones. Las programaciones son independientes y no se afectan entre sí a menos que los horarios se superpongan.
-
Seleccione una de las siguientes opciones:
-
Programar y ejecutar ahora: el trabajo se ejecuta inmediatamente y, posteriormente, se ejecuta según las programaciones.
-
Solo programar: el trabajo solo se ejecuta según las programaciones que usted especifique.
-
Seleccione Exportar después de haber rellenado el resto de la configuración de trabajos de exportación.
Puede usar la SageMaker IA AWS Management Console para ver los trabajos que están programados para ejecutarse. Sus trabajos de procesamiento se ejecutan en Canalizaciones. Cada trabajo de procesamiento tiene su propia canalización. Se ejecuta como un paso de procesamiento dentro de la canalización. Puede ver las programaciones que ha creado dentro de una canalización. Para obtener información acerca de cómo visualizar una canalización, consulte Visualización de los detalles de una canalización.
Utilice el siguiente procedimiento para ver los trabajos que ha programado.
Para ver los trabajos que ha programado, haga lo siguiente.
-
Abre Amazon SageMaker Studio Classic.
-
Abra Canalizaciones
-
Vea las canalizaciones de los trabajos que ha creado.
La canalización que ejecuta el trabajo usa el nombre del trabajo como prefijo. Por ejemplo, si ha creado un trabajo denominado housing-data-feature-enginnering
, el nombre de la canalización es canvas-data-prep-housing-data-feature-engineering
.
-
Elija la canalización que contiene su trabajo.
-
Vea el estado de las canalizaciones. Las canalizaciones con un Estado Correcto han ejecutado el trabajo de procesamiento correctamente.
Para detener la ejecución del trabajo de procesamiento, haga lo siguiente:
Para detener la ejecución de un trabajo de procesamiento, elimine la regla de eventos que especifica la programación. Al eliminar una regla de eventos, se detiene la ejecución de todos los trabajos asociados a la programación. Para obtener información sobre cómo eliminar una regla, consulta Cómo deshabilitar o eliminar una EventBridge regla de Amazon.
También puede detener y eliminar las canalizaciones asociadas a las programaciones. Para obtener información sobre cómo detener una canalización, consulta StopPipelineExecution. Para obtener información sobre la eliminación de una canalización, consulte DeletePipeline.