Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Configuration d'un EMR cluster Amazon pour qu'il continue ou s'arrête après l'exécution de l'étape
Cette rubrique explique les différences entre l'utilisation d'un cluster de longue durée et la création d'un cluster transitoire qui s'arrête après l'exécution de la dernière étape. Il explique également comment configurer l'exécution des étapes pour un cluster.
Création d'un cluster à long terme
Par défaut, les clusters que vous créez avec la console ou le AWS CLI sont de longue durée. Les clusters de longue durée continuent de fonctionner, d'accepter du travail et d'accumuler des frais jusqu'à ce que vous preniez des mesures pour les arrêter.
Un cluster de longue durée est efficace dans les situations suivantes :
-
Lorsque vous devez interroger des données de manière interactive ou automatique.
-
Lorsque vous devez interagir en permanence avec des applications Big Data hébergées sur le cluster.
-
Lorsque vous traitez périodiquement un jeu de données si important ou si fréquent qu'il est inefficace de lancer de nouveaux clusters et de charger les données à chaque fois.
Vous pouvez également définir une protection contre les interruptions sur un cluster de longue durée afin d'éviter de fermer des EC2 instances par accident ou par erreur. Pour de plus amples informations, veuillez consulter Utiliser la protection contre la résiliation pour protéger vos EMR clusters Amazon contre les arrêts accidentels.
Note
Amazon active EMR automatiquement la protection contre la résiliation pour tous les clusters comportant plusieurs nœuds principaux et remplace tous les paramètres d'exécution des étapes que vous fournissez lors de la création du cluster. Vous pouvez désactiver la protection contre la résiliation après le lancement du cluster. Consultez Configuration de la protection contre la résiliation pour les clusters en cours d'exécution. Pour résilier un cluster comportant plusieurs nœuds primaires, vous devez d'abord modifier les attributs du cluster afin de désactiver la protection contre la résiliation. Pour obtenir des instructions, consultez Mettre fin à un EMR cluster Amazon comportant plusieurs nœuds principaux.
Configurer un cluster pour qu'il se résilie après l'exécution de l'étape
Lorsque vous configurez la résiliation après l'exécution des étapes, le cluster démarre, exécute des actions d'amorçage, puis exécute les étapes que vous spécifiez. Dès que la dernière étape est terminée, Amazon EMR met fin aux EC2 instances Amazon du cluster. L'exécution par étapes est activée par défaut sur EMR API les clusters que vous lancez avec Amazon.
Le fait de résilier après l'exécution d'une étape est efficace pour les clusters qui effectuent une tâche de traitement périodique, telle qu'une exécution quotidienne de traitement de données. L'exécution des étapes vous permet également de vous assurer que vous n'êtes facturé que pour le temps nécessaire au traitement de vos données. Pour plus d'informations sur ces étapes, consultez Soumettre un travail à un EMR cluster Amazon.