Use a escalabilidade de EMR cluster da Amazon para se ajustar às mudanças nas cargas de trabalho - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Use a escalabilidade de EMR cluster da Amazon para se ajustar às mudanças nas cargas de trabalho

Você pode ajustar o número de EC2 instâncias da Amazon disponíveis para um EMR cluster da Amazon de forma automática ou manual em resposta às cargas de trabalho que têm demandas variadas. Há duas opções para usar a escalabilidade automática. Você pode ativar a escalabilidade EMR gerenciada da Amazon ou criar uma política personalizada de escalabilidade automática. A tabela a seguir descreve as diferenças entre as duas opções.

Escalabilidade EMR gerenciada pela Amazon Escalabilidade automática personalizada

Políticas e regras de escalabilidade

Nenhuma política necessária. A Amazon EMR gerencia a atividade de escalabilidade automática avaliando continuamente as métricas do cluster e tomando decisões de escalabilidade otimizadas.

É necessário definir e gerenciar as políticas e as regras de ajuste de escala automático, como as condições específicas que acionam ações de ajuste de escala, períodos de avaliação, períodos de esfriamento etc.

EMRLançamentos compatíveis da Amazon

Amazon EMR versão 5.30.0 e superior (exceto Amazon EMR versão 6.0.0)

Amazon EMR versão 4.0.0 e superior

Composição de cluster compatível

Grupos de instâncias ou frotas de instâncias

Somente grupos de instâncias

Configuração de limites de escalabilidade

Os limites de escalabilidade são configurados para todo o cluster.

Os limites de escalabilidade só podem ser configurados para cada grupo de instâncias.

Frequência da avaliação de métricas

A cada 5 a 10 segundos

A avaliação mais frequente das métricas permite que EMR a Amazon tome decisões de escalabilidade mais precisas.

É possível definir os períodos de avaliação apenas em incrementos de cinco minutos.

Aplicações compatíveis

Somente YARN aplicativos são suportados, como Spark, Hadoop, Hive, Flink. A escalabilidade EMR gerenciada da Amazon não oferece suporte a aplicativos que não sejam baseados emYARN, como Presto ou. HBase

Você pode escolher quais aplicativos são compatíveis ao definir as regras de escalabilidade automática.

Considerações

  • Um EMR cluster da Amazon sempre compreende um ou três nós primários. Depois de configurar o cluster inicialmente, você só pode escalar os nós centrais e de tarefas. Você não pode escalar o número de nós primários para o cluster.

  • Para grupos de instâncias, as operações de reconfiguração e redimensionamento ocorrem consecutivamente e não simultaneamente. Se você iniciar uma reconfiguração enquanto um grupo de instâncias estiver sendo redimensionado, a reconfiguração será iniciada quando o grupo de instâncias concluir o redimensionamento em andamento. Por outro lado, se você iniciar uma operação de redimensionamento enquanto uma instância agrupa sua reconfiguração.