Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Ajouter des étapes à un cluster Amazon EMR à l'aide du AWS CLI
Les procédures suivantes montrent comment ajouter des étapes à un cluster nouvellement créé et à un cluster en cours d'exécution à l'aide de l'interface AWS CLI. Dans les deux exemples, la sous-commande --steps
est utilisée pour ajouter des étapes au cluster.
Pour ajouter des étapes lors de la création du cluster
-
Tapez la commande suivante pour créer un cluster et ajouter une étape Apache Pig. Assurez-vous de le remplacer
par le nom de votre paire de EC2 clés Amazon.myKey
aws emr create-cluster --name "
Test cluster
" \ --applications Name=Spark
\ --use-default-roles \ --ec2-attributes KeyName=myKey
\ --instance-groups InstanceGroupType=PRIMARY
,InstanceCount=1
,InstanceType=m5.xlarge
InstanceGroupType=CORE
,InstanceCount=2
,InstanceType=m5.xlarge
\ --steps '[{"Args":["spark-submit","--deploy-mode","cluster","--class","org.apache.spark.examples.SparkPi","/usr/lib/spark/examples/jars/spark-examples.jar","5"],"Type":"CUSTOM_JAR","ActionOnFailure":"CONTINUE","Jar":"command-runner.jar","Properties":"","Name":"Spark application"}]'Note
La liste des arguments change en fonction du type d'étape.
Par défaut, le niveau de simultanéité des étapes est
1
. Vous pouvez définir le niveau de simultanéité des étapes à l'aide du paramètreStepConcurrencyLevel
lorsque vous créez un cluster.Le résultat est un identifiant de cluster similaire au suivant.
{ "ClusterId": "j-2AXXXXXXGAPLF" }
Pour ajouter une étape à un cluster en cours d'exécution
-
Tapez la commande suivante pour ajouter une étape à un cluster en cours d'exécution. Remplacez
par votre propre identifiant de cluster.j-2AXXXXXXGAPLF
aws emr add-steps --cluster-id
j-2AXXXXXXGAPLF
\ --steps '[{"Args":["spark-submit","--deploy-mode","cluster","--class","org.apache.spark.examples.SparkPi","/usr/lib/spark/examples/jars/spark-examples.jar","5"],"Type":"CUSTOM_JAR","ActionOnFailure":"CONTINUE","Jar":"command-runner.jar","Properties":"","Name":"Spark application"}]'Le résultat est un identifiant d'étape similaire au suivant.
{ "StepIds": [ "s-Y9XXXXXXAPMD" ] }
Pour modifier le StepConcurrencyLevel dans un cluster en cours d'exécution
-
Dans un cluster en cours d'exécution, vous pouvez le modifier le
StepConcurrencyLevel
à l'aide de l'APIModifyCluster
. Par exemple, tapez la commande suivante pour augmenter le paramètre leStepConcurrencyLevel
ou le10
. Remplacez
par votre propre identifiant de cluster.j-2AXXXXXXGAPLF
aws emr modify-cluster --cluster-id
j-2AXXXXXXGAPLF
--step-concurrency-level 10 -
La sortie est similaire à ce qui suit.
{ "StepConcurrencyLevel": 10 }
Pour plus d'informations sur l'utilisation des commandes Amazon EMR dans le AWS CLI, consultez la référence des AWS CLI commandes.