Supervisión de trabajos de Ray con métricas - AWS Glue

Supervisión de trabajos de Ray con métricas

Puede supervisar los trabajos de Ray mediante AWS Glue Studio y Amazon CloudWatch. CloudWatch recopila y procesa las métricas sin formato desde AWS Glue con Ray, lo que las hace disponibles para el análisis. Estas métricas se visualizan en la consola de AWS Glue Studio, por lo que puede supervisar el trabajo a medida que se ejecuta.

Para obtener información general sobre cómo supervisar AWS Glue, consulte Supervisión de AWS Glue con métricas de Amazon CloudWatch. Para obtener una descripción general de cómo utilizar las métricas de CloudWatch publicadas por AWS Glue, consulte Monitoreo de con Amazon CloudWatch.

Supervisión de los trabajos de Ray en la consola de AWS Glue

En la página de detalles para una ejecución de trabajo, debajo de la sección Detalles de ejecución, puede consultar los gráficos agregados prediseñados que visualizan las métricas de trabajo disponibles. AWS Glue Studio envía las métricas del trabajo a CloudWatch para cada ejecución de trabajo. Con ellas, puede crear un perfil del clúster y las tareas y acceder a información detallada sobre cada nodo.

Para obtener más información sobre los gráficos de métricas disponibles, consulte Visualización de métricas de Amazon CloudWatch para una ejecución de trabajo de Ray.

Información general de las métricas de trabajos de Ray en CloudWatch

Publicamos las métricas de Ray cuando la supervisión detallada está habilitada en CloudWatch. Las métricas se publican en el espacio de nombres de CloudWatch Glue/Ray.

  • Métricas de la instancia

    Publicamos métricas acerca del uso de la CPU, la memoria y el disco de las instancias asignadas a un trabajo. Estas métricas se identifican mediante características como ExecutorId, ExecutorType y host. Estas métricas son un subconjunto de las métricas estándar de los agentes de CloudWatch de Linux. Puede encontrar información sobre los nombres y características de las métricas en la documentación de CloudWatch. Para más información, consulte Métricas que el agente de CloudWatch ha recopilado.

  • Métricas del clúster de Ray

    Reenviamos las métricas de los procesos de Ray que ejecutan el script en este espacio de nombres, luego proporcionamos los más críticos. Las métricas disponibles pueden diferir según la versión de Ray. Para más información sobre qué versión de Ray está en ejecución en su trabajo, consulte Versiones de AWS Glue.

    Ray recopila métricas al nivel de instancia. También proporciona métricas para las tareas y el clúster. Para obtener más información sobre la estrategia de métricas subyacente de Ray, consulte Métricas en la documentación de Ray.

nota

No publicamos las métricas de Ray en el espacio de nombres de Glue/Job Metrics/, que solo se usa para trabajos de ETL de AWS Glue.