Exibição e monitoramento de um cluster do Amazon EMR enquanto executa trabalhos
O Amazon EMR fornece várias ferramentas que você pode usar para coletar informações sobre o cluster. Você pode acessar informações sobre o cluster a partir do console, da CLI ou de forma programática. As interfaces Web padrão do Hadoop e os arquivos de log estão disponíveis no nó primário. Você também pode usar serviços de monitoramento, como o CloudWatch e o Ganglia para rastrear a performance do cluster.
O histórico do aplicativo também está disponível no console usando as interfaces do usuário de aplicativos “persistentes” para o servidor de histórico do Spark a partir da versão Amazon EMR 5.25.0. Com o Amazon EMR 6.x, o servidor persistente de linha de tempo do YARN e as interfaces do usuário Tez também estão disponíveis. Esses serviços são hospedados fora do cluster, portanto, você pode acessar o histórico de aplicativos por 30 dias após o encerramento do cluster, sem a necessidade de uma conexão SSH ou proxy da Web. Consulte Visualizar o histórico da aplicação.
Tópicos
- Exibição de status e detalhes do cluster do Amazon EMR
- Etapa aprimorada de depuração com o Amazon EMR
- Como exibir o histórico da aplicação do Amazon EMR
- Exibição dos arquivos de log do Amazon EMR
- Visualizar instâncias de cluster no Amazon EC2
- Eventos e métricas do CloudWatch no Amazon EMR
- Exibição das métricas para aplicações de cluster usando o Ganglia com Amazon EMR
- Registro em log de chamadas de API do AWS EMR usando o AWS CloudTrail