Errore EMR del cluster Amazon: errore di spazio HDFS insufficiente - Amazon EMR

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Errore EMR del cluster Amazon: errore di spazio HDFS insufficiente

Se si tenta di rimuovere un nodo principale, può verificarsi un errore di spazio insufficiente in Hadoop Distributed File System (HDFS), ma Amazon non EMR può completare l'operazione in modo sicuro a causa dello spazio rimasto insufficiente nel. HDFS Prima che Amazon EMR rimuova un nodo principale, tutti HDFS i dati sul nodo devono essere trasferiti su altri nodi principali per garantire la ridondanza dei dati. Tuttavia, se non c'è abbastanza spazio sugli altri nodi principali per la replica, Amazon non EMR può disattivare il nodo senza problemi.

Possibili cause

Consulta quanto segue per un elenco delle possibili cause dell'errore di spazio insufficiente: HDFS

  • Se si ridimensiona manualmente un gruppo di istanze principale o un parco di istanze quando non c'è abbastanza HDFS spazio sui nodi rimanenti per la replica dei dati prima della scalabilità verso il basso.

  • La scalabilità gestita o la scalabilità automatica riducono un gruppo di istanze principale o un parco di istanze quando non c'è abbastanza spazio per la replica dei dati. HDFS

  • Amazon EMR tenta di sostituire un nodo principale non integro, ma non è in grado di sostituirlo in modo sicuro a causa HDFS dello spazio insufficiente.

Soluzioni e best practice

Per le soluzioni e le best practice, consulta quanto segue:

  • Aumenta il numero di nodi principali nel tuo EMR cluster Amazon. Se utilizzi la scalabilità gestita o la scalabilità automatica, aumenta la capacità minima dei tuoi nodi principali.

  • Usa EBS volumi più grandi per i nodi principali quando crei il cluster. EMR

  • Elimina i HDFS dati non necessari nel EMR cluster. Ti consigliamo di impostare CloudWatch allarmi per monitorare la HDFSUtilization metrica nel cluster per sapere se lo spazio nel EMR cluster è insufficiente.