

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Commencer à utiliser EMR Serverless depuis la console
<a name="gs-console"></a>

Cette section décrit l'utilisation d'EMR Serverless, notamment la création d'un studio EMR. Il décrit également comment soumettre des exécutions de tâches et consulter les journaux.

**Topics**
+ [Étape 1 : Création d'une application EMR sans serveur](#gs-application-console)
+ [Étape 2 : Soumettre une exécution de tâche ou une charge de travail interactive](#gs-job-run-console)
+ [Étape 3 : Afficher l'interface utilisateur et les journaux de l'application](#gs-output-console)
+ [Étape 4 : nettoyer](#gs-cleanup-console)

## Étape 1 : Création d'une application EMR sans serveur
<a name="gs-application-console"></a>

Créez une nouvelle application avec EMR Serverless comme suit.

1. [Connectez-vous à la console Amazon EMR AWS Management Console et ouvrez-la à https://console.aws.amazon.com l'adresse /emr.](https://console.aws.amazon.com/emr)

1. Dans le volet de navigation de gauche, choisissez **EMR Serverless** pour accéder à la page d'accueil EMR Serverless.

1. Pour créer ou gérer des applications EMR Serverless, vous avez besoin de l'interface utilisateur d'EMR Studio.
   + Si vous disposez déjà d'un studio EMR dans Région AWS lequel vous souhaitez créer une application, sélectionnez **Gérer les applications** pour accéder à votre studio EMR ou sélectionnez le studio que vous souhaitez utiliser. 
   + Si vous ne disposez pas d'un studio EMR dans l' Région AWS endroit où vous souhaitez créer une application, choisissez **Commencer**, puis Choisissez **Créer et lancez** Studio. EMR Serverless crée pour vous un studio EMR afin que vous puissiez créer et gérer des applications.

1. Dans l'interface utilisateur de **Create studio** qui s'ouvre dans un nouvel onglet, entrez le nom, le type et la version de publication de votre application. Si vous souhaitez uniquement exécuter des tâches par lots, sélectionnez **Utiliser les paramètres par défaut pour les tâches par lots uniquement**. Pour les charges de travail interactives, sélectionnez **Utiliser les paramètres par défaut pour les charges de travail interactives**. Vous pouvez également exécuter des tâches par lots sur des applications interactives grâce à cette option. Si nécessaire, vous pouvez modifier ces paramètres ultérieurement.

   Pour plus d'informations, voir [Création d'un studio](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-studio-create-studio.html).

1. Sélectionnez **Créer une application** pour créer votre première application. 

Passez à la section suivante [Étape 2 : Soumettre une exécution de tâche ou une charge de travail interactive](#gs-job-run-console) pour soumettre une exécution de tâche ou une charge de travail interactive.

## Étape 2 : Soumettre une exécution de tâche ou une charge de travail interactive
<a name="gs-job-run-console"></a>

------
#### [ Spark job run ]

Dans ce didacticiel, nous utilisons un PySpark script pour calculer le nombre d'occurrences de mots uniques dans plusieurs fichiers texte. Un compartiment S3 public en lecture seule stocke à la fois le script et le jeu de données.

**Pour exécuter une tâche Spark**

1. Téléchargez l'exemple de script `wordcount.py` dans votre nouveau compartiment à l'aide de la commande suivante.

   ```
   aws s3 cp s3://us-east-1.elasticmapreduce/emr-containers/samples/wordcount/scripts/wordcount.py s3://amzn-s3-demo-bucket/scripts/
   ```

1. Si vous [Étape 1 : Création d'une application EMR sans serveur](#gs-application-console) le complétez, vous accédez à la page des **détails de l'application** dans EMR Studio. À cet endroit, choisissez l'option **Soumettre le travail**.

1. Sur la page **Soumettre une tâche**, effectuez les opérations suivantes.
   + Dans le champ **Nom**, entrez le nom que vous souhaitez appeler votre tâche exécutée.
   + Dans le champ **Rôle d'exécution**, entrez le nom du rôle que vous avez créé dans[Création d'un rôle d'exécution de tâches](getting-started.md#gs-runtime-role).
   + Dans le champ **Emplacement du script**, entrez `s3://amzn-s3-demo-bucket/scripts/wordcount.py` l'URI S3.
   + Dans le champ **Arguments du script**, entrez`["s3://amzn-s3-demo-bucket/emr-serverless-spark/output"]`.
   + Dans la section **des propriétés de Spark**, choisissez **Modifier sous forme de texte** et entrez les configurations suivantes.

     ```
     --conf spark.executor.cores=1 --conf spark.executor.memory=4g --conf spark.driver.cores=1 --conf spark.driver.memory=4g --conf spark.executor.instances=1
     ```

1. Pour démarrer l'exécution de la tâche, choisissez **Soumettre la tâche**.

1. Dans l'onglet **Exécutions de tâches**, vous devriez voir votre nouvelle tâche exécutée avec le statut En **cours d'exécution**.

------
#### [ Hive job run ]

Dans cette partie du didacticiel, nous créons une table, insérons quelques enregistrements et exécutons une requête d'agrégation de comptes. Pour exécuter la tâche Hive, créez d'abord un fichier contenant toutes les requêtes Hive à exécuter dans le cadre d'une tâche unique, téléchargez le fichier sur S3 et spécifiez ce chemin S3 au démarrage de la tâche Hive.

**Pour exécuter une tâche Hive**

1. Créez un fichier appelé `hive-query.ql` contenant toutes les requêtes que vous souhaitez exécuter dans votre tâche Hive.

   ```
   create database if not exists emrserverless;
   use emrserverless;
   create table if not exists test_table(id int);
   drop table if exists Values__Tmp__Table__1;
   insert into test_table values (1),(2),(2),(3),(3),(3);
   select id, count(id) from test_table group by id order by id desc;
   ```

1. `hive-query.ql`Téléchargez-le dans votre compartiment S3 à l'aide de la commande suivante.

   ```
   aws s3 cp hive-query.ql s3://amzn-s3-demo-bucket/emr-serverless-hive/query/hive-query.ql
   ```

1. Si vous [Étape 1 : Création d'une application EMR sans serveur](#gs-application-console) le complétez, vous accédez à la page des **détails de l'application** dans EMR Studio. À cet endroit, choisissez l'option **Soumettre le travail**.

1. Sur la page **Soumettre une tâche**, effectuez les opérations suivantes.
   + Dans le champ **Nom**, entrez le nom que vous souhaitez appeler votre tâche exécutée.
   + Dans le champ **Rôle d'exécution**, entrez le nom du rôle que vous avez créé dans[Création d'un rôle d'exécution de tâches](getting-started.md#gs-runtime-role).
   + Dans le champ **Emplacement du script**, entrez `s3://amzn-s3-demo-bucket/emr-serverless-hive/query/hive-query.ql` l'URI S3.
   + Dans la section **Propriétés de la ruche**, choisissez **Modifier sous forme de texte** et entrez les configurations suivantes.

     ```
     --hiveconf hive.log.explain.output=false
     ```
   + Dans la section **Configuration du Job**, choisissez **Modifier au format JSON**, puis entrez le code JSON suivant.

     ```
     {
        "applicationConfiguration": 
        [{
            "classification": "hive-site",
               "properties": {
                   "hive.exec.scratchdir": "s3://amzn-s3-demo-bucket/emr-serverless-hive/hive/scratch",
                   "hive.metastore.warehouse.dir": "s3://amzn-s3-demo-bucket/emr-serverless-hive/hive/warehouse",
                   "hive.driver.cores": "2",
                   "hive.driver.memory": "4g",
                   "hive.tez.container.size": "4096",
                   "hive.tez.cpu.vcores": "1"
                }
         }]
     }
     ```

1. Pour démarrer l'exécution de la tâche, choisissez **Soumettre la tâche**.

1. Dans l'onglet **Exécutions de tâches**, vous devriez voir votre nouvelle tâche exécutée avec le statut En **cours d'exécution**.

------
#### [ Interactive workload ]

Avec Amazon EMR 6.14.0 et versions ultérieures, vous pouvez utiliser des blocs-notes hébergés dans EMR Studio pour exécuter des charges de travail interactives pour Spark dans EMR Serverless. Pour plus d'informations, notamment sur les autorisations et les conditions requises, consultez[Exécutez des charges de travail interactives avec EMR Serverless via EMR Studio](interactive-workloads.md).

Une fois que vous avez créé votre application et configuré les autorisations requises, procédez comme suit pour exécuter un bloc-notes interactif avec EMR Studio :

1. Accédez à l'onglet **Espaces de travail** dans EMR Studio. Si vous devez toujours configurer un emplacement de stockage Amazon S3 et un [rôle de service EMR Studio](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-studio-service-role.html), sélectionnez le bouton **Configurer le studio** dans la bannière en haut de l'écran.

1. Pour accéder à un bloc-notes, sélectionnez un espace de travail ou créez-en un nouveau. Utilisez **le lancement rapide** pour ouvrir votre espace de travail dans un nouvel onglet.

1. Accédez à l'onglet qui vient d'être ouvert. Sélectionnez l'icône **Calculer** dans le menu de navigation de gauche. **Sélectionnez EMR Serverless comme type de calcul.**

1. Sélectionnez l'application interactive que vous avez créée dans la section précédente.

1. Dans le champ **Rôle d'exécution**, entrez le nom du rôle IAM que votre application EMR Serverless peut assumer pour l'exécution de la tâche. Pour en savoir plus sur les rôles d'exécution, consultez la section [Rôles d'exécution Job](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/security-iam-runtime-role.html) dans le guide de l'*utilisateur Amazon EMR Serverless*.

1. Sélectionnez **Joindre**. Cela peut prendre jusqu'à une minute. La page sera actualisée une fois jointe.

1. Choisissez un noyau et lancez un bloc-notes. Vous pouvez également consulter des exemples de blocs-notes sur EMR Serverless et les copier dans votre espace de travail. Pour accéder aux exemples de blocs-notes, accédez au **`{...}`**menu de navigation de gauche et parcourez les blocs-notes dont le nom de fichier est indiqué `serverless` dans le bloc-notes.

1. Dans le bloc-notes, vous pouvez accéder au lien du journal du pilote et à un lien vers l'interface utilisateur d'Apache Spark, une interface en temps réel qui fournit des indicateurs pour surveiller votre travail. Pour plus d'informations, consultez la section [Surveillance des applications et des tâches EMR sans serveur](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/app-job-metrics.html) dans le guide de l'utilisateur Amazon *EMR* Serverless.

Lorsque vous associez une application à un espace de travail Studio, le démarrage de l'application se déclenche automatiquement si elle n'est pas déjà en cours d'exécution. Vous pouvez également prédémarrer l'application et la garder prête avant de l'associer à l'espace de travail.

------

## Étape 3 : Afficher l'interface utilisateur et les journaux de l'application
<a name="gs-output-console"></a>

Pour afficher l'interface utilisateur de l'application, identifiez d'abord le travail exécuté. Une option pour l'**interface utilisateur Spark** ou **Hive Tez** est disponible dans la première ligne d'options pour cette tâche exécutée, en fonction du type de tâche. Sélectionnez l'option appropriée.

Si vous avez choisi l'interface utilisateur Spark, cliquez sur l'onglet **Executors** pour afficher les journaux des pilotes et des exécuteurs. Si vous avez choisi l'interface utilisateur Hive Tez, cliquez sur l'onglet **Toutes les tâches** pour afficher les journaux.

Une fois que le statut d'exécution de la tâche indique **Success**, vous pouvez consulter le résultat de la tâche dans votre compartiment S3.

## Étape 4 : nettoyer
<a name="gs-cleanup-console"></a>

Bien que l'application que vous avez créée doive s'arrêter automatiquement après 15 minutes d'inactivité, nous vous recommandons tout de même de libérer des ressources que vous n'avez pas l'intention de réutiliser.

Pour supprimer l'application, accédez à la page **Répertorier les applications**. Sélectionnez l'application que vous avez créée et choisissez **Actions → Arrêter** pour arrêter l'application. Une fois que l'application est dans `STOPPED` cet état, sélectionnez-la et choisissez **Actions → Supprimer**.

Pour d'autres exemples d'exécution de tâches Spark et Hive, consultez [Utilisation des configurations Spark lorsque vous exécutez des tâches EMR sans serveur](jobs-spark.md) et[Utilisation de configurations Hive lorsque vous exécutez des tâches EMR sans serveur](jobs-hive.md).