Erreur EMR du cluster Amazon : nœuds listés par refus

Le NodeManager daemon est chargé de lancer et de gérer les conteneurs sur les nœuds principaux et les nœuds de tâches. Les conteneurs sont alloués au NodeManager démon par le ResourceManager démon qui s'exécute sur le nœud maître. Le ResourceManager surveille le NodeManager nœud par un battement de cœur.

Dans certaines situations, le ResourceManager daemon deny répertorie a NodeManager, le supprimant du pool de nœuds disponibles pour traiter les tâches :

Si aucun battement de cœur n' NodeManager a été envoyé au ResourceManager daemon au cours des 10 dernières minutes (600 000 millisecondes). Cette période de temps peut être configurée à l'aide du paramètre de configuration yarn.nm.liveness-monitor.expiry-interval-ms. Pour plus d'informations sur la modification des paramètres de configuration de Yarn, consultez la section Configuration des applications dans le Amazon EMR Release Guide.
NodeManager vérifie l'état des disques déterminé par yarn.nodemanager.local-dirs etyarn.nodemanager.log-dirs. Les vérifications incluent les autorisations et l'espace disque disponible (< 90 %). Si un disque échoue à la vérification, il NodeManager cesse de l'utiliser mais indique toujours que l'état du nœud est sain. Si plusieurs disques échouent à la vérification, le nœud est signalé comme étant défectueux ResourceManager et aucun nouveau conteneur ne lui est attribué.

Le responsable de l'application peut également refuser de NodeManager répertorier un nœud si plus de trois tâches ont échoué. Vous pouvez le remplacer par une valeur plus élevée à l'aide du paramètre de configuration mapreduce.job.maxtaskfailures.per.tracker. D'autres paramètres de configuration que vous pouvez modifier contrôlent le nombre de tentatives pour une tâche avant de l'indiquer comme ayant échoué : mapreduce.map.max.attempts pour les tâches Map et mapreduce.reduce.maxattempts pour les tâches Reduce. Pour plus d'informations sur la modification des paramètres de configuration, consultez la section Configuration des applications dans le Amazon EMR Release Guide.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Erreur EMR du cluster Amazon : le fichier n'a pu être répliqué que sur 0 nœud au lieu de 1

Limitation des erreurs liées à un cluster Amazon EMR