Monitorar o AWS Glue usando métricas do Amazon CloudWatch
É possível criar perfis e monitorar operações do AWS Glue usando o criador de perfis de tarefas do AWS Glue. Ele coleta e processa dados brutos de trabalhos do AWS Glue e os transforma em métricas legíveis, quase em tempo real, armazenadas no Amazon CloudWatch. Essas estatísticas são retidas e agregadas no CloudWatch, para que você possa acessar informações históricas e obter uma perspectiva melhor sobre como sua aplicação está se saindo.
nota
Você pode incorrer em cobranças adicionais ao habilitar que métricas de trabalho e métricas personalizadas do CloudWatch sejam criadas. Para obter mais informações, consulte Preço do Amazon CloudWatch
Visão geral das métricas do AWS Glue
Quando você interage com o AWS Glue, ele envia métricas ao CloudWatch. É possível visualizar essas métricas usando o console do AWS Glue (o método de preferência), o painel do console do CloudWatch ou a AWS Command Line Interface (AWS CLI).
Para visualizar as métricas usando o painel do console do AWS Glue
Você pode visualizar gráficos de métricas detalhados ou resumidos de uma tarefa, ou gráficos detalhadas da execução de uma tarefa.
Faça login no AWS Management Console e abra o console do AWS Glue em https://console.aws.amazon.com/glue/
. -
No painel de navegação, escolha Monitoramento de execução de trabalho.
-
Em Execuções de trabalhos, escolha Ações para interromper um trabalho que está em execução no momento, exibir um trabalho ou retroceder o marcador de trabalho.
-
Selecione um trabalho e escolha Exibir detalhes da execução para ver informações adicionais sobre a execução do trabalho.
Para exibir métricas usando o painel do console do CloudWatch
As métricas são agrupadas primeiro pelo namespace do serviço e, em seguida, por várias combinações de dimensão dentro de cada namespace.
-
Abra o console do CloudWatch em https://console.aws.amazon.com/cloudwatch/
. -
No painel de navegação, selecione Métricas.
-
Selecione o namespace Glue.
Para visualizar métricas usando a AWS CLI
-
Em um prompt de comando, use o seguinte comando.
aws cloudwatch list-metrics --namespace Glue
O AWS Glue relata métricas para o CloudWatch a cada 30 segundos, e os painéis de métricas do CloudWatch são configurados para exibi-las a cada minuto. As métricas do AWS Glue representam valores do delta a partir dos valores relatados anteriormente. Quando apropriado, os painéis de métricas agregam (somam) os valores de 30 segundos para obter um valor para o último minuto inteiro.
Comportamento de métricas do AWS Glue para trabalhos do Spark
As métricas do AWS Glue são ativadas na inicialização de um GlueContext
em um script e geralmente são atualizadas somente no final de um trabalho do Apache Spark. Eles representam os valores agregados em todas as tarefas do Spark concluídas até agora.
No entanto, as métricas do Spark que o AWS Glue transfere para o CloudWatch são geralmente valores absolutos que representam o estado atual no momento em que elas são relatadas. O AWS Glue as informa ao CloudWatch a cada 30 segundos, e os painéis de métricas geralmente mostram a média em todos os pontos de dados recebidos no último minuto.
Os nomes de métricas do AWS Glue são todos precedidos por um dos seguintes tipos de prefixo:
glue.driver.
: métricas cujos nomes começam com esse prefixo representam métricas do AWS Glue agregadas em todos os executores no driver do Spark ou métricas do Spark correspondentes ao driver do Spark.glue.
executorId.
: o executorId é o número de um executor específico do Spark. Ele corresponde ao executores listados nos logs.glue.ALL.
- Métricas cujos nomes começam com esse prefixo agregam valor a todos os executores do Spark.
AWS Glue métricas
O AWS Glue traça o perfil e envia as seguintes métricas para o CloudWatch a cada 30 segundos, e o painel do console do AWS Glue as relata uma vez por minuto:
Métrica | Descrição |
---|---|
|
O número de bytes lidos de todas as fontes de dados por todas as tarefas do Spark concluídas em execução em todos os executores. Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. Unidade: bytes Pode ser usada para monitorar:
Essa métrica pode ser usada da mesma maneira que a métrica |
|
O tempo de ETL decorrido em milissegundos (não inclui os tempos de bootstrap do trabalho). Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. Unidade: milissegundos Pode ser usado para determinar quanto tempo leva em média para uma execução de trabalho ser executada. Algumas maneiras de usar os dados:
|
|
O número de etapas concluídas no trabalho. Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. Unidade: contagem Pode ser usada para monitorar:
Algumas maneiras de usar os dados:
|
|
O número de tarefas concluídas no trabalho. Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. Unidade: contagem Pode ser usada para monitorar:
|
|
O número de tarefas que falharam. Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. Unidade: contagem Pode ser usada para monitorar:
Os dados podem ser usados para definir alarmes para falhas aumentadas que possam sugerir anormalidades em dados, cluster ou scripts. |
|
O número de tarefas encerradas. Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. Unidade: contagem Pode ser usada para monitorar:
Algumas maneiras de usar os dados:
|
|
O número de registros lidos de todas as fontes de dados por todas as tarefas do Spark concluídas em execução em todos os executores. Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. Unidade: contagem Pode ser usada para monitorar:
Essa métrica pode ser usada da mesma maneira que a métrica |
|
O número de bytes gravados por todos os executores para gerar a ordem aleatória de dados entre eles desde o relatório anterior (agregado pelo painel de métricas do AWS Glue como o número de bytes gravados para esse fim durante o minuto anterior). Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. Unidade: bytes Pode ser usado para monitorar: ordem aleatória de dados em trabalhos (junções grandes, groupBy, repartição, união). Algumas maneiras de usar os dados:
|
|
O número de bytes lidos por todos os executores para gerar a ordem aleatória dos dados entre eles desde o relatório anterior (agregado pelo painel de métricas do AWS Glue como o número de bytes lidos para esse fim durante o minuto anterior). Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. Unidade: bytes Pode ser usado para monitorar: ordem aleatória de dados em trabalhos (junções grandes, groupBy, repartição, união). Algumas maneiras de usar os dados:
|
|
O número de megabytes de espaço em disco usado em todos os executores. Dimensões válidas: Estatística válida: média. Essa é uma métrica do Spark, relatada como um valor absoluto. Unidade: megabytes Pode ser usada para monitorar:
Algumas maneiras de usar os dados:
|
|
O número de executores ativamente executando trabalhos. Dimensões válidas: Estatística válida: média. Essa é uma métrica do Spark, relatada como um valor absoluto. Unidade: contagem Pode ser usada para monitorar:
Algumas maneiras de usar os dados:
|
|
O número máximo de executores de trabalho (em execução ativa e pendentes) necessários para satisfazer a carga atual. Dimensões válidas: Estatísticas válidas: máximo. Essa é uma métrica do Spark, relatada como um valor absoluto. Unidade: contagem Pode ser usada para monitorar:
Algumas maneiras de usar os dados:
|
|
A fração de memória usada pelo heap da JVM para este driver (escala: 0 a 1) pelo driver, executor identificado por executorId ou TODOS os executores. Dimensões válidas: Estatística válida: média. Essa é uma métrica do Spark, relatada como um valor absoluto. Unidade: porcentagem Pode ser usada para monitorar:
Algumas maneiras de usar os dados:
|
|
O número de bytes de memória usados pelo heap da JVM para o driver, o executor identificado por executorId ou TODOS os executores. Dimensões válidas: Estatística válida: média. Essa é uma métrica do Spark, relatada como um valor absoluto. Unidade: bytes Pode ser usada para monitorar:
Algumas maneiras de usar os dados:
|
|
O número de bytes lidos do Amazon S3 pelo driver, um executor identificado por executorId ou TODOS os executores desde o relatório anterior (agregado pelo painel de métricas do AWS Glue como o número de bytes lidos durante o minuto anterior). Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. A área sob a curva no painel de métricas do AWS Glue pode ser usada para comparar visualmente os bytes lidos por duas execuções de trabalho diferentes. Unidade: Bytes. Pode ser usada para monitorar:
Os dados resultantes podem ser usados para:
|
|
O número de bytes gravados no Amazon S3 pelo driver, um executor identificado por executorId ou TODOS os executores desde o relatório anterior (agregado pelo painel de métricas do AWS Glue como o número de bytes gravados durante o minuto anterior). Dimensões válidas: Estatística válida: SUM (SOMA). Essa métrica é um valor delta do último valor relatado, portanto, no painel de métricas do AWS Glue, uma estatística SUM (SOMA) é usada para agregação. A área sob a curva no painel de métricas do AWS Glue pode ser usada para comparar visualmente os bytes gravados por duas execuções de trabalho diferentes. Unidade: bytes Pode ser usada para monitorar:
Algumas maneiras de usar os dados:
|
|
O número de registros que são recebidos em um microlote. Essa métrica só está disponível para os trabalhos de transmissão do AWS Glue com o AWS Glue versão 2.0 e posterior. Dimensões válidas: Estatísticas válidas: soma , máximo, mínimo, média, porcentagem Unidade: contagem Pode ser usada para monitorar:
|
|
O tempo necessário para processar os lotes em milissegundos. Essa métrica só está disponível para os trabalhos de transmissão do AWS Glue com o AWS Glue versão 2.0 e posterior. Dimensões válidas: Estatísticas válidas: soma , máximo, mínimo, média, porcentagem Unidade: contagem Pode ser usada para monitorar:
|
|
A fração de carga de sistema da CPU usada (escala: 0 a 1) pelo driver, um executor identificado por executorId ou TODOS os executores. Dimensões válidas: Estatística válida: média. Essa métrica é relatada como um valor absoluto. Unidade: porcentagem Pode ser usada para monitorar:
Algumas maneiras de usar os dados:
|
Dimensões para métricas do AWS Glue
As métricas do AWS Glue usam namespace do AWS Glue e fornecem métricas para as seguintes dimensões:
Dimensão | Descrição |
---|---|
|
Esta dimensão filtra as métricas de todas as execuções de trabalho de um trabalho do AWS Glue. |
|
Esta dimensão filtra as métricas de um trabalho do AWS Glue específico executado por um ID JobRun ou |
|
Esta dimensão filtra as métricas por |
Para mais informações, consulte o Guia do usuário do Amazon CloudWatch.