Planejamento, configuração e inicialização de clusters do Amazon EMR
Esta seção explica as opções de configuração e instruções para o planejamento, a configuração e a execução de clusters usando o Amazon EMR. Antes de executar um cluster, você faz escolhas sobre o seu sistema com base nos dados que está processando e nos seus requisitos de custo, velocidade, capacidade, disponibilidade, segurança e gerenciabilidade. Suas opções incluem:
-
Em qual região executar um cluster, onde e como armazenar dados e como gerar a saída dos resultados. Consulte Configurar o armazenamento de dados e o local do cluster do Amazon EMR.
-
Se você está executando clusters do Amazon EMR no Outposts ou em zonas locais. Consulte Clusters do EMR no AWS Outposts ou Clusters EMR em zonas locais da AWS.
-
Se um cluster é transitório ou de longa execução, e quais softwares ele executa. Consulte Configuração de um cluster do Amazon EMR para continuar ou encerrar após a execução da etapa e Configuração de aplicações ao iniciar o cluster do Amazon EMR.
-
Se um cluster tem um único nó primário ou três nós primários. Consulte Planejar e configurar nós primários no cluster do Amazon EMR.
-
As opções de hardware e rede que otimizam o custo, o desempenho e a disponibilidade do seu aplicativo. Consulte Configuração de hardware e redes do cluster do Amazon EMR.
-
Como configurar clusters, para que você possa gerenciá-los com mais facilidade e monitorar as atividades, o desempenho e a integridade. Consulte Configuração de registro em log e depuração do cluster do Amazon EMR e Marcação e categorização dos recursos de cluster do Amazon EMR.
-
Como autenticar e autorizar o acesso aos recursos do cluster e como criptografar os dados. Consulte Segurança no Amazon EMR.
-
Como integrar-se com outros softwares e serviços. Consulte Integração de drivers e aplicações de terceiros no Amazon EMR.