Métricas do Hadoop e do Spark no Ganglia

nota

A última versão do Amazon EMR a incluir o Ganglia foi o Amazon EMR 6.15.0. Para monitorar seu cluster, as versões superiores à 6.15.0 incluem o agente do Amazon CloudWatch.

O Ganglia informa as métricas do Hadoop para cada instância. Os vários tipos de métricas são prefixados de acordo com a categoria: sistema de arquivos distribuído (dfs.*), máquina virtual Java (jvm.*), MapReduce (mapred.*) e chamadas de procedimento remoto (rpc.*).

As métricas do Ganglia com base no YARN, como o Spark e o Hadoop, não estão disponíveis para as versões 4.4.0 e 4.5.0 do EMR. Use uma versão mais recente para usar essas métricas.

As métricas do Ganglia para o Spark geralmente têm prefixos para o ID de aplicativo do YARN e para o DAGScheduler do Spark. Portanto, os prefixos sigam este formato:

DAGScheduler.*
application_xxxxxxxxxx_xxxx.driver.*
application_xxxxxxxxxx_xxxx.executor.*

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Visualizar métricas do Ganglia

Histórico de versões do Ganglia