Habilitación del registro continuo para trabajos de AWS Glue - AWS Adherencia

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Habilitación del registro continuo para trabajos de AWS Glue

Puede habilitar el registro continuo a través de la consola de AWS Glue o a través de la AWS Command Line Interface (AWS CLI).

Puede habilitar el registro continuo al crear un trabajo nuevo, editar un trabajo existente o habilitarlo a través de AWS CLI.

También puede especificar opciones de configuración personalizadas, como el nombre del grupo de registro de Amazon CloudWatch, el prefijo de flujo de registro de CloudWatch antes del ID de controlador/ID de ejecutor de ejecución del trabajo de AWS Glue, así como el patrón de conversión de registro para los mensajes de registro. Estas configuraciones le ayudan a establecer registros agregados en grupos de registros personalizados de CloudWatch con diferentes políticas de caducidad y a analizarlos con prefijos de flujo de registro personalizados y patrones de conversión.

Uso de la AWS Management Console

Siga estos pasos para usar la consola para habilitar el registro continuo al crear o editar un trabajo de AWS Glue.

Para crear un nuevo trabajo de AWS Glue con registro continuo
  1. Inicie sesión en la AWS Management Console y abra la consola de AWS Glue en https://console.aws.amazon.com/glue/.

  2. En el panel de navegación, seleccione Trabajos de ETL.

  3. Seleccione Visual ETL.

  4. En la pestaña Detalles del trabajo, expanda la sección Propiedades avanzadas.

  5. En la sección Registro continuo, seleccione Habilitar registros en CloudWatch.

Para habilitar el registro continuo para un trabajo de AWS Glue que ya tenga
  1. Abra la consola de AWS Glue en https://console.aws.amazon.com/glue/.

  2. En el panel de navegación, seleccione Trabajos.

  3. Elija el trabajo que ya tiene en la lista Jobs (Trabajos).

  4. Elija Action (Acción), Edit job (Editar trabajo).

  5. En la pestaña Detalles del trabajo, expanda la sección Propiedades avanzadas.

  6. En la sección Registro continuo, seleccione Habilitar registros en CloudWatch.

Mediante AWS CLI

Para habilitar el registro continuo debe transferir los parámetros de trabajo a un trabajo de AWS Glue. Transfiera los parámetros de trabajos especiales similares que figuran a continuación a otros parámetros de trabajo de AWS Glue. Para obtener más información, consulte Uso de los parámetros de trabajo en los trabajos de AWS Glue.

'--enable-continuous-cloudwatch-log': 'true'

Puede especificar un nombre de grupo de registro personalizado de Amazon CloudWatch. Si no se especifica, el nombre predeterminado del grupo de registro es /aws-glue/jobs/logs-v2/.

'--continuous-log-logGroup': 'custom_log_group_name'

Puede especificar un prefijo de flujo de registro personalizado de Amazon CloudWatch. Si no se especifica, el prefijo de flujo de registro predeterminado es el ID de ejecución del trabajo.

'--continuous-log-logStreamPrefix': 'custom_log_stream_prefix'

Puede especificar un patrón de conversión de registro continuo personalizado. Si no se especifica, el patrón de conversión predeterminado es %d{yy/MM/dd HH:mm:ss} %p %c{1}: %m%n. Tenga en cuenta que el patrón de conversión solo se aplica a los registros de controlador y ejecutor. No afecta a la barra de progreso de AWS Glue.

'--continuous-log-conversionPattern': 'custom_log_conversion_pattern'

Registro de mensajes específicos de aplicación con el registrador de script personalizado

Puede utilizar el registrador de AWS Glue para registrar todos los mensajes específicos de la aplicación en el script que se envían en tiempo real al flujo de registro del controlador.

En el siguiente ejemplo se muestra un script de Python.

from awsglue.context import GlueContext from pyspark.context import SparkContext sc = SparkContext() glueContext = GlueContext(sc) logger = glueContext.get_logger() logger.info("info message") logger.warn("warn message") logger.error("error message")

En el siguiente ejemplo se muestra un script de Scala.

import com.amazonaws.services.glue.log.GlueLogger object GlueApp { def main(sysArgs: Array[String]) { val logger = new GlueLogger logger.info("info message") logger.warn("warn message") logger.error("error message") } }

Habilitación de la barra de progreso para mostrar el progreso del trabajo

AWS Glue proporciona una barra de progreso en tiempo real bajo el flujo de registro JOB_RUN_ID-progress-bar para comprobar el estado de ejecución de un trabajo de AWS Glue. En la actualidad se admiten únicamente los trabajos que inicializan glueContext. Si ejecuta un trabajo de Spark puro sin inicializar glueContext, la barra de progreso de AWS Glue no aparece.

La barra de progreso muestra la siguiente actualización del progreso cada 5 segundos.

Stage Number (Stage Name): > (numCompletedTasks + numActiveTasks) / totalNumOfTasksInThisStage]

Configuración de seguridad con registro continuo.

Si se habilita una configuración de seguridad para los registros de CloudWatch, AWS Glue creará un grupo de registro llamado de la siguiente manera para los registros continuos:

<Log-Group-Name>-<Security-Configuration-Name>

Los grupos de registro predeterminados y personalizados serán de la siguiente manera:

  • El grupo de registro continuo predeterminado será /aws-glue/jobs/logs-v2-<Security-Configuration-Name>

  • El grupo de registro continuo personalizado será <custom-log-group-name>-<Security-Configuration-Name>

Debe agregar logs:AssociateKmsKey a sus permisos de rol de IAM, si habilita una configuración de seguridad con CloudWatch Logs. Si no se incluye ese permiso, se deshabilitará el registro continuo. Además, para configurar el cifrado de CloudWatch Logs, siga las instrucciones en Cifrar datos de registro en CloudWatch Logs mediante AWS Key Management Service en la Guía del usuario de Amazon CloudWatch Logs.

Para obtener más información sobre cómo crear una configuración de seguridad, consulte Administrar las configuraciones de seguridad en la AWS Glue consola.