Etapa 2: iniciar um cluster do Amazon EMR
Nesta etapa, você irá configurar e iniciar um cluster do Amazon EMR. O Hive e um handler de armazenamento para DynamoDB já estarão instalados no cluster.
Abra o console do Amazon EMR em https://console.aws.amazon.com/emr
. -
Selecione Create Cluster (Criar cluster).
-
Na página Create Cluster - Quick Options, faça o seguinte:
-
Em Cluster name, digite um nome para o seu cluster (por exemplo:
My EMR cluster
). -
Em EC2 key pair, escolha o par de chaves que você criou mais cedo.
Deixe as outras configurações nos valores padrão.
-
-
Selecione Criar cluster.
Vários minutos serão necessários para o cluster ser iniciado. Você pode usar a página Cluster Details (Detalhes do cluster) no console do Amazon EMR para monitorar seu progresso.
Quando o status mudar para Waiting
, o cluster estará pronto para uso.
Arquivos de log do cluster e Amazon S3
Um cluster do Amazon EMR gera arquivos de log que contêm informações sobre o status do cluster e as informações de depuração. As configurações padrão de Create Cluster – Quick Options (Criar cluster – Opções rápidas) incluem a configuração do registro em log do Amazon EMR.
O AWS Management Console criará um bucket do Amazon S3, caso ainda não exista um. O nome do bucket é aws-logs-
, onde account-id
-region
é o número da sua conta da AWS e account-id
é a região em que você iniciou o cluster (por exemplo, region
aws-logs-123456789012-us-west-2
).
nota
Você pode usar o console do Amazon S3 para visualizar os arquivos de log. Para obter mais informações, consulte Visualizar arquivos de log no Guia de gerenciamento do Amazon EMR.
Você pode usar esse bucket para outras finalidades, além do log. Por exemplo, você pode usar o bucket como um local para armazenar um script do Hive ou como um destino ao exportar dados do Amazon DynamoDB para o Amazon S3.