As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Uso de uma política de encerramento automático para limpeza de cluster do Amazon EMR
Uma política de término automático permite orquestrar a limpeza do cluster sem a necessidade de monitorar e terminar manualmente os clusters não utilizados. Ao adicionar uma política de término automático a um cluster, especifique a quantidade de tempo ocioso após o qual o cluster deverá ser desligado automaticamente.
Dependendo da versão, o Amazon EMR usa critérios diferentes para marcar um cluster como ocioso. A tabela a seguir descreve como o Amazon EMR determina a ociosidade do cluster.
Quando você usa... | O cluster é considerado ocioso quando... |
---|---|
Amazon EMR versões 5.34.0 e posteriores e 6.4.0 e posteriores |
|
Amazon EMR versões 5.30.0 a 5.33.0 e 6.1.0 a 6.3.0 |
notaO Amazon EMR marca um cluster como ocioso e pode terminá-lo automaticamente mesmo se você tiver um kernel Python3 ativo. Isso ocorre porque a execução de um kernel do Python3 não envia um trabalho do Spark no cluster. Para usar o encerramento automático com um kernel do Python3, recomendamos usar a versão 6.4.0 ou as versões posteriores do Amazon EMR. |
nota
O Amazon EMR versões 6.4.0 e posteriores oferecem suporte a um arquivo no cluster para detectar atividades no nó primário: /emr/metricscollector/isbusy
. Ao usar um cluster para executar scripts de shell ou aplicações que não sejam do YARN, você pode tocar ou atualizar isbusy
periodicamente para informar ao Amazon EMR que o cluster não está ocioso.
É possível anexar uma política de término automático ao criar um cluster ou adicionar uma política a um cluster atual. Para alterar ou desabilitar o término automático, é possível atualizar ou remover a política.
Considerações
Leve em consideração os atributos e as limitações a seguir antes de usar uma política de término automático:
-
A seguir Regiões da AWS, a terminação automática do Amazon EMR está disponível com o Amazon EMR 6.14.0 e superior:
-
Europa (Espanha) (eu-south-2)
-
-
A seguir Regiões da AWS, a terminação automática do Amazon EMR está disponível com o Amazon EMR 5.30.0 e 6.1.0 e versões superiores:
Leste dos EUA (Norte da Virgínia) (us-east-1)
Leste dos EUA (Ohio) (us-east-2)
Oeste dos EUA (Oregon) (us-west-2)
Oeste dos EUA (Norte da Califórnia) (us-west-1)
África (Cidade do Cabo) (af-south-1)
Ásia-Pacífico (Hong Kong) (ap-east-1)
Ásia-Pacífico (Mumbai) (ap-south-1)
-
Ásia-Pacífico (Hyderabad) (ap-south-2)
Ásia-Pacífico (Seul) (ap-northeast-2)
Ásia-Pacífico (Osaka) (ap-northeast-3)
Ásia-Pacífico (Singapura) (ap-southeast-1)
Ásia-Pacífico (Sydney) (ap-southeast-2)
-
Ásia-Pacífico (Jacarta) (ap-southeast-3)
Ásia Pacific (Tóquio) (ap-northeast-1)
Canadá (Central) (ca-central-1)
América do Sul (São Paulo) (sa-east-1)
Europa (Frankfurt) (eu-central-1)
Europa (Zurique) (eu-central-2)
Europa (Irlanda) (eu-west-1)
Europa (Londres) (eu-west-2)
UE (Milão) (eu-south-1)
Europa (Paris) (eu-west-3)
UE (Estocolmo) (eu-north-1)
Israel (Tel Aviv) (il-central-1)
Oriente Médio (EAU) (me-central-1)
China (Pequim) (cn-north-1)
China (Ningxia) (cn-northwest-1)
AWS GovCloud (Leste dos EUA) (us-gov-east-1)
AWS GovCloud (Oeste dos EUA) (us-gov-west-1)
-
O tempo limite ocioso é padronizado para 60 minutos (uma hora) quando não há um valor especificado. Você pode especificar um tempo limite ocioso mínimo de um minuto e um tempo limite ocioso máximo de sete dias.
-
Com o Amazon EMR versões 6.4.0 e posteriores, o término automático é habilitado por padrão quando você cria um novo cluster usando o console do Amazon EMR.
-
O Amazon EMR publica Amazon CloudWatch métricas de alta resolução quando você ativa o encerramento automático de um cluster. Use essas métricas para monitorar a atividade e a ociosidade do cluster. Para obter mais informações, consulte Métricas de capacidade de cluster.
-
A terminação automática não é suportada quando você usa aplicativos não baseados em Yarn, como Presto, Trino ou. HBase
-
Para usar o término automático, o processo coletor de métricas deve ser capaz de se conectar ao endpoint público da API para o término automático no API Gateway. Se você usar um nome DNS privado com Amazon Virtual Private Cloud, o encerramento automático não funcionará corretamente. Para garantir que o término automático funcione, é recomendável executar uma das seguintes ações:
-
Remova o endpoint da VPC de interface do API Gateway da Amazon VPC.
-
Siga as instruções em Por que recebo um erro HTTP 403 Proibido ao me conectar ao meu API Gateway a APIs partir de uma VPC
? para desativar a configuração do nome DNS privado. -
Em vez disso, inicie o cluster em sua sub-rede privada. Para obter mais informações, consulte o tópico em Sub-redes privadas.
-
-
(Amazon EMR 5.30.0 e versões posteriores) Se você remover a regra de saída Permitir tudo padrão para 0.0.0.0/ para o grupo de segurança primário, deverá adicionar uma regra que permita a conectividade TCP de saída ao grupo de segurança para acesso ao serviço na porta 9443. O grupo de segurança para acesso ao serviço também deve permitir tráfego TCP de entrada na porta 9443 do grupo de segurança primário. Para obter mais informações sobre como configurar grupos de segurança, consulte Amazon EMR-managed security group for the primary instance (private subnets).
Permissões para usar o término automático
Antes de aplicar e gerenciar políticas de término automático para o Amazon EMR, é necessário anexar as permissões listadas no exemplo a seguir da política de permissões do IAM aos recursos do IAM que gerenciam o cluster do EMR.
{ "Version": "2012-10-17", "Statement": { "Sid": "AllowAutoTerminationPolicyActions", "Effect": "Allow", "Action": [ "elasticmapreduce:PutAutoTerminationPolicy", "elasticmapreduce:GetAutoTerminationPolicy", "elasticmapreduce:RemoveAutoTerminationPolicy" ], "Resource": "
<your-resources>
" } }
Anexar, atualizar ou remover uma política de término automático
Esta seção contém instruções que ajudam a anexar, atualizar ou remover uma política de término automático de um cluster do Amazon EMR. Antes de trabalhar com políticas de término automático, verifique se você tem as permissões do IAM necessárias. Consulte Permissões para usar o término automático.