Monitorar trabalhos Spark do AWS Glue - AWS Glue

Monitorar trabalhos Spark do AWS Glue

Métricas do Spark disponíveis no AWS Glue Studio

A guia Metrics (Métricas) mostra métricas coletadas quando um trabalho é executado e a criação de perfil está ativada. Os seguintes gráficos são exibidos em trabalhos do Spark:

  • Movimentação de dados ETL

  • Perfil de memória: driver e executores

Escolha View additional metrics (Ver métricas adicionais) para mostrar os gráficos a seguir:

  • Movimentação de dados ETL

  • Perfil de memória: driver e executores

  • Embaralhamento de dados em executores

  • Carga da CPU: driver e executores

  • Execução de trabalho: executores ativos, estágios concluídos e executores máximos necessários

Os dados para esses gráficos serão enviados para as métricas do CloudWatch se o trabalho estiver configurado para coletar métricas. Para obter mais informações sobre como ativar métricas e interpretar os gráficos, consulte Monitoramento e depuração de trabalho.

exemplo Grafo de movimentação de dados de ETL

O gráfico de movimentação de dados ETL mostra as seguintes métricas:

O gráfico para movimentação de dados de ETL na guia Metrics (Métricas) do console do AWS Glue.
exemplo Grafo de perfil de memória

O gráfico de perfil de memória mostra as seguintes métricas:

O gráfico para perfil de memória na guia Metrics (Métricas) do console do AWS Glue.
exemplo Grafo de embaralhamento de dados em executores

O gráfico de embaralhamento de dados nos executores mostra as seguintes métricas:

O gráfico de ordem aleatória de dados entre executores na guia Metrics (Métricas) do console do AWS Glue.
exemplo Grafo de carga de CPU

O gráfico de carga de CPU mostra as seguintes métricas:

O gráfico para carga da CPU na guia Metrics (Métricas) do console do AWS Glue.
exemplo Grafo de execução de trabalho

O gráfico de execução de trabalho mostra as seguintes métricas:

O gráfico para execução de trabalho na guia Metrics (Métricas) do console do AWS Glue.