

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Conceitos básicos do EMR Sem Servidor usando o console
<a name="gs-console"></a>

Esta seção descreve o trabalho com o EMR Sem Servidor, incluindo a criação de um EMR Studio. Também descreve como enviar execuções de trabalhos e exibir logs.

**Topics**
+ [Etapa 1: criar uma aplicação do EMR Sem Servidor](#gs-application-console)
+ [Etapa 2: enviar uma execução de trabalho ou workload interativa](#gs-job-run-console)
+ [Etapa 3: exibir a interface do usuário da aplicação e os logs](#gs-output-console)
+ [Etapa 4: limpar](#gs-cleanup-console)

## Etapa 1: criar uma aplicação do EMR Sem Servidor
<a name="gs-application-console"></a>

Crie uma aplicação com o EMR Sem Servidor da maneira a seguir.

1. [Faça login no Console de gerenciamento da AWS e abra o console do Amazon EMR em https://console.aws.amazon.com /emr.](https://console.aws.amazon.com/emr)

1. No painel de navegação à esquerda, escolha **EMR Sem Servidor** para navegar até a página de destino do EMR Sem Servidor.

1. Para criar ou gerenciar aplicações do EMR Sem Servidor, você precisa da interface do EMR Studio.
   + Se você já tiver um EMR Studio no Região da AWS local em que deseja criar um aplicativo, selecione **Gerenciar aplicativos** para navegar até seu EMR Studio ou selecione o estúdio que deseja usar. 
   + Se você não tiver um EMR Studio no local em Região da AWS que deseja criar um aplicativo, escolha **Começar** e, em seguida, escolha **Criar e iniciar o** Studio. O EMR Sem Servidor cria um EMR Studio para você, para que consiga criar e gerenciar aplicações.

1. Na interface do usuário de **Criar Studio** que se abre em uma nova guia, insira o nome, o tipo e a versão de lançamento da aplicação. Se você quiser executar somente trabalhos em lotes, selecione **Usar configurações padrão somente para trabalhos em lotes**. Para workloads interativas, selecione **Usar configurações padrão para workloads interativas**. Você também pode executar trabalhos em lotes em aplicações interativas com essa opção. Se necessário, você poderá alterar essas configurações posteriormente.

   Para obter mais informações, consulte [Create a studio](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-studio-create-studio.html).

1. Selecione **Criar aplicação** para criar sua primeira aplicação. 

Continue na próxima seção [Etapa 2: enviar uma execução de trabalho ou workload interativa](#gs-job-run-console) para enviar uma execução de trabalho ou uma workload interativa.

## Etapa 2: enviar uma execução de trabalho ou workload interativa
<a name="gs-job-run-console"></a>

------
#### [ Spark job run ]

Neste tutorial, usamos um PySpark script para calcular o número de ocorrências de palavras únicas em vários arquivos de texto. Um bucket do S3 público e somente leitura armazena o script e o conjunto de dados.

**Para executar um trabalho do Spark**

1. Faça o upload do exemplo de script `wordcount.py` para o novo bucket com o comando a seguir.

   ```
   aws s3 cp s3://us-east-1.elasticmapreduce/emr-containers/samples/wordcount/scripts/wordcount.py s3://amzn-s3-demo-bucket/scripts/
   ```

1. A conclusão de [Etapa 1: criar uma aplicação do EMR Sem Servidor](#gs-application-console) leva você à página **Detalhes da aplicação** no EMR Studio. Lá, escolha a opção **Enviar trabalho**.

1. Na página **Enviar trabalho**, conclua o procedimento a seguir.
   + No campo **Nome**, insira o nome que você deseja chamar para a execução do trabalho.
   + No campo **Perfil de runtime**, digite o nome do perfil criado em [Criação de um perfil de runtime de trabalhos](getting-started.md#gs-runtime-role).
   + No campo **Localização do script**, insira `s3://amzn-s3-demo-bucket/scripts/wordcount.py` como URI do S3.
   + No campo **Argumentos do script**, insira `["s3://amzn-s3-demo-bucket/emr-serverless-spark/output"]`.
   + Na seção **Propriedades do Spark**, escolha **Editar como texto** e insira as configurações a seguir.

     ```
     --conf spark.executor.cores=1 --conf spark.executor.memory=4g --conf spark.driver.cores=1 --conf spark.driver.memory=4g --conf spark.executor.instances=1
     ```

1. Para iniciar a execução do trabalho, escolha **Enviar trabalho**.

1. Na guia **Execuções de trabalhos**, será exibido seu novo trabalho sendo executado com o status **Em execução**.

------
#### [ Hive job run ]

Nesta parte do tutorial, criamos uma tabela, inserimos alguns registros e executamos uma consulta de agregação de contagem. Para executar o trabalho do Hive, primeiro crie um arquivo que contenha todas as consultas do Hive a serem executadas como parte de um único trabalho, faça upload do arquivo no S3 e especifique esse caminho do S3 ao iniciar o trabalho do Hive.

**Para executar um trabalho do Hive**

1. Crie um arquivo chamado `hive-query.ql` que contenha todas as consultas que você deseja executar no trabalho do Hive.

   ```
   create database if not exists emrserverless;
   use emrserverless;
   create table if not exists test_table(id int);
   drop table if exists Values__Tmp__Table__1;
   insert into test_table values (1),(2),(2),(3),(3),(3);
   select id, count(id) from test_table group by id order by id desc;
   ```

1. Faça upload de `hive-query.ql` no bucket do S3 com o comando a seguir.

   ```
   aws s3 cp hive-query.ql s3://amzn-s3-demo-bucket/emr-serverless-hive/query/hive-query.ql
   ```

1. A conclusão de [Etapa 1: criar uma aplicação do EMR Sem Servidor](#gs-application-console) leva você à página **Detalhes da aplicação** no EMR Studio. Lá, escolha a opção **Enviar trabalho**.

1. Na página **Enviar trabalho**, conclua o procedimento a seguir.
   + No campo **Nome**, insira o nome que você deseja chamar para a execução do trabalho.
   + No campo **Perfil de runtime**, digite o nome do perfil criado em [Criação de um perfil de runtime de trabalhos](getting-started.md#gs-runtime-role).
   + No campo **Localização do script**, insira `s3://amzn-s3-demo-bucket/emr-serverless-hive/query/hive-query.ql` como URI do S3.
   + Na seção **Propriedades do Hive**, escolha **Editar como texto** e insira as configurações a seguir.

     ```
     --hiveconf hive.log.explain.output=false
     ```
   + Na seção **Configuração do trabalho**, escolha **Editar como JSON** e insira o JSON a seguir.

     ```
     {
        "applicationConfiguration": 
        [{
            "classification": "hive-site",
               "properties": {
                   "hive.exec.scratchdir": "s3://amzn-s3-demo-bucket/emr-serverless-hive/hive/scratch",
                   "hive.metastore.warehouse.dir": "s3://amzn-s3-demo-bucket/emr-serverless-hive/hive/warehouse",
                   "hive.driver.cores": "2",
                   "hive.driver.memory": "4g",
                   "hive.tez.container.size": "4096",
                   "hive.tez.cpu.vcores": "1"
                }
         }]
     }
     ```

1. Para iniciar a execução do trabalho, escolha **Enviar trabalho**.

1. Na guia **Execuções de trabalhos**, será exibido seu novo trabalho sendo executado com o status **Em execução**.

------
#### [ Interactive workload ]

Com o Amazon EMR 6.14.0 e superior, você pode usar cadernos hospedados no EMR Studio para executar workloads interativas para o Spark no EMR Sem Servidor. Para obter mais informações, incluindo permissões e pré-requisitos, consulte [Execução de workloads interativas com o EMR Sem Servidor por meio do EMR Studio](interactive-workloads.md).

Depois de criar a aplicação e configurar as permissões necessárias, use as seguintes etapas para executar um caderno interativo com o EMR Studio:

1. Navegue até a guia **Workspaces** no EMR Studio. Se você ainda precisar configurar um local de armazenamento do Amazon S3 e um [perfil de serviço do EMR Studio](https://docs.aws.amazon.com/emr/latest/ManagementGuide/emr-studio-service-role.html), selecione o botão **Configurar Studio** no banner na parte superior da tela.

1. Para acessar um caderno, selecione um Workspace ou crie um. Use o **Início rápido** para abrir seu Workspace em uma nova guia.

1. Vá para a guia recém-aberta. Selecione o ícone **Computação** na navegação esquerda. Selecione EMR Sem Servidor como o **Tipo de computação**.

1. Selecione a aplicação interativa que você criou na seção anterior.

1. No campo **Perfil de runtime**, insira o nome do perfil do IAM que a aplicação do EMR Sem Servidor pode assumir para a execução do trabalho. Para saber mais sobre os perfis de runtime, consulte [Job runtime roles](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/security-iam-runtime-role.html) no *Guia do usuário do Amazon EMR Sem Servidor*.

1. Selecione **Anexar**. Esse processo pode levar até um minuto. A página será atualizada quando anexada.

1. Escolha um kernel e inicie um caderno. Você também pode procurar exemplos de cadernos no EMR Sem Servidor e copiá-los para o Workspace. Para acessar os exemplos de cadernos, navegue até o menu **`{...}`** na navegação à esquerda e acesse os cadernos que têm `serverless` no nome do arquivo do caderno.

1. No caderno, você pode acessar o link do log do driver e um link para a interface do usuário do Apache Spark, uma interface em tempo real que fornece métricas para monitorar seu trabalho. Para obter mais informações, consulte [Monitoring EMR Sem Servidor applications and jobs](https://docs.aws.amazon.com/emr/latest/EMR-Serverless-UserGuide/app-job-metrics.html) no *Guia do usuário do Amazon EMR Sem Servidor*.

Quando você anexa uma aplicação a um Workspace do Studio, o início dela é acionado automaticamente se ainda não estiver em execução. Você também pode pré-iniciar a aplicação e mantê-la pronta antes de anexá-la ao Workspace.

------

## Etapa 3: exibir a interface do usuário da aplicação e os logs
<a name="gs-output-console"></a>

Para exibir a interface do usuário da aplicação, primeiro identifique a execução do trabalho. Uma opção para a **interface do usuário do Spark** ou a **interface do usuário do Hive Tez** está disponível na primeira linha de opções para a execução desse trabalho, com base no tipo de trabalho. Selecione a opção apropriada.

Se você escolheu a interface do usuário do Spark, selecione a guia **Executores** para exibir os logs do driver e dos executores. Se você escolheu a interface do usuário do Hive Tez, selecione a guia **Todas as tarefas** para exibir os logs.

Depois que o status de execução do trabalho for exibido como **Êxito**, você poderá exibir a saída do trabalho no bucket do S3.

## Etapa 4: limpar
<a name="gs-cleanup-console"></a>

Embora a aplicação criada deva parar automaticamente após 15 minutos de inatividade, ainda recomendamos que você libere recursos que não pretende usar novamente.

Para excluir a aplicação, navegue até a página **Listar aplicações**. Selecione a aplicação que você criou e escolha **Ações → Interromper** para interromper a aplicação. Depois que a aplicação estiver no estado `STOPPED`, selecione a mesma aplicação e escolha **Ações → Excluir**.

Para obter mais exemplos de execução de trabalhos do Spark e do Hive, consulte [Uso das configurações do Spark ao executar trabalhos do EMR Sem Servidor](jobs-spark.md) e [Uso das configurações do Hive ao executar trabalhos do EMR Sem Servidor](jobs-hive.md).