Erro de cluster do Amazon EMR: erro de espaço insuficiente no HDFS - Amazon EMR

Erro de cluster do Amazon EMR: erro de espaço insuficiente no HDFS

Um erro de espaço insuficiente do Sistema de Arquivos Distribuído do Hadoop (HDFS) pode ocorrer se você tentar remover um nó central, mas o Amazon EMR não pode concluir a operação com segurança devido à falta de espaço no HDFS. Antes que o Amazon EMR remova um nó central, todos os dados do HDFS no nó devem ser transferidos para outros nós centrais para garantir a redundância dos dados. No entanto, se não houver espaço suficiente nos outros nós centrais para replicação, o Amazon EMR não poderá desativar o nó.

Possíveis causas

Confira esta lista das possíveis causas do erro de espaço insuficiente no HDFS:

  • Se você reduzir manualmente a escala de um grupo de instâncias centrais ou de uma frota de instâncias quando não houver espaço suficiente no HDFS nos nós restantes para replicação de dados antes de reduzir a escala verticalmente.

  • O ajuste de escala gerenciado ou automático reduzem verticalmente a escala de um grupo de instâncias centrais ou de uma frota de instâncias quando não há espaço suficiente no HDFS para a replicação de dados.

  • O Amazon EMR tenta substituir um nó central não íntegro, mas não consegue substituí-lo com segurança devido ao espaço insuficiente no HDFS.

Soluções e práticas recomendadas

Consulte as seguintes informações para obter as soluções e práticas recomendadas:

  • Aumente verticalmente a escala do número de nós centrais no cluster do Amazon EMR. Se você usa ajuste de escala gerenciado ou automático, aumente a capacidade mínima dos nós centrais.

  • Use volumes maiores do EBS para os nós centrais ao criar o cluster do EMR.

  • Exclua dados do HDFS desnecessários no cluster do EMR. Recomendamos que você configure os alarmes do CloudWatch para monitorar a métrica HDFSUtilization no cluster para saber se o cluster do EMR está com pouco espaço.