Uso da proteção contra encerramento para proteger clusters do Amazon EMR do desligamento acidental - Amazon EMR

Uso da proteção contra encerramento para proteger clusters do Amazon EMR do desligamento acidental

A proteção contra encerramento protege os clusters do encerramento acidental, o que pode ser especialmente útil para clusters de longa execução que processam workloads críticas. Quando a proteção contra encerramento está habilitada em um cluster de longa execução, você ainda poderá encerrar o cluster, mas deverá removê-la explicitamente do cluster primeiro. Isso ajuda a garantir que as instâncias do EC2 não sejam encerradas por acidente ou erro. Você pode habilitar a proteção contra encerramento ao criar um cluster e alterar a configuração em um cluster em execução.

Com a proteção contra término habilitada, a ação TerminateJobFlows na API do Amazon EMR não funciona. Os usuários não podem encerrar o cluster usando essa API nem o comando terminate-clusters da AWS CLI. A API retornará um erro, e a CLI será encerrada com um código de retorno diferente de zero. Quando você usar o console do Amazon EMR para encerrar um cluster, será solicitado que você execute uma etapa adicional para desativar a proteção contra término.

Atenção

A proteção contra término não garante que os dados sejam retidos em caso de erro humano ou de solução alternativa. Por exemplo, se um comando de reinicialização for emitido pela linha de comando enquanto estiver conectado à instância usando SSH, se uma aplicação ou um script em execução na instância emitir um comando de reinicialização ou se a API do Amazon EC2 ou do Amazon EMR for usada para desabilitar a proteção contra término. Isso também vale se estiver executando as versões 7.1 e superiores do Amazon EMR e uma instância se tornar não íntegra e irrecuperável. Mesmo com a proteção contra término habilitada, os dados salvos no armazenamento da instância, inclusive dados do HDFS, poderão ser perdidos. Grave a saída de dados nos locais do Amazon S3 e crie estratégias de backup conforme a necessidade de seus requisitos de continuidade de negócios.

A proteção contra encerramento não afeta sua capacidade de dimensionar recursos de cluster usando qualquer uma das seguintes ações:

Proteção contra término e o Amazon EC2

A configuração de proteção contra encerramento em um cluster do Amazon EMR corresponde ao atributo DisableApiTermination de todas as instâncias do Amazon EC2 no cluster. Por exemplo, se habilitar a proteção contra encerramento em um cluster do EMR, o Amazon EMR automaticamente define DisableApiTermination como verdadeiro para todas as instâncias do EC2 no cluster do EMR. O mesmo se aplica se você desabilitar a proteção contra encerramento. O Amazon EMR define automaticamente DisableApiTermination como falso para todas as instâncias do EC2 no cluster do EMR. Se você encerrar ou reduzir verticalmente a escala de um cluster do Amazon EMR e as configurações do Amazon EC2 entrarem em conflito para uma instância do EC2, o Amazon EMR priorizará a configuração do Amazon EMR sobre as configurações DisableApiStop e DisableApiTermination no Amazon EC2 e continuará a encerrar a instância do EC2.

Por exemplo, você pode usar o console do Amazon EC2 para habilitar a proteção contra encerramento em uma instância do Amazon EC2 em um cluster do EMR com a proteção contra encerramento desabilitada. Se você encerrar ou reduzir verticalmente a escala do cluster com o console do Amazon EMR, a AWS CLI ou a API do Amazon EMR, o Amazon EMR substituirá a configuração DisableApiTermination, a definirá como falsa e encerrará a instância com outras instâncias.

Você também pode usar o console do Amazon EC2 para habilitar a proteção contra interrupção em uma instância do Amazon EC2 em um cluster do EMR com a proteção contra encerramento desabilitada. Se você encerrar ou reduzir verticalmente a escala do cluster, o Amazon EMR define DisableApiStop como falso no Amazon EC2 e encerra a instância com outras instâncias.

O Amazon EMR substitui a configuração DisableApiStop somente quando você encerra ou reduz verticalmente a escala de um cluster. Quando você habilita ou desabilita a proteção contra encerramento em um cluster do EMR, o Amazon EMR não altera a configuração disableApiStop de nenhuma das instâncias do EC2 no respectivo cluster do EMR.

Importante

Se uma instância for criada como parte de um cluster do Amazon EMR com proteção contra encerramento, e a API do Amazon EC2 ou os comandos da AWS CLI forem usados para modificar a instância para que DisableApiTermination seja false, a API do Amazon EC2 ou os comandos da AWS CLI executarão a operação TerminateInstances, e a instância do Amazon EC2 será encerrada.

Proteção contra término e nós não íntegros do YARN

O Amazon EMR verifica periodicamente o status do Apache Hadoop YARN de nós em execução nas instâncias centrais e de tarefa do Amazon EC2 em um cluster. O status de integridade é relatado pelo serviço de verificação de integridade NodeManager. Se um nó informar UNHEALTHY, o controlador de instâncias do Amazon EMR adicionará o nó à lista de negação e não alocará contêineres YARN a ele até que se torne íntegro novamente. Dependendo do status da proteção contra encerramento, da substituição de nós não íntegros e da versão de lançamento do Amazon EMR, o Amazon EMR substituirá a instância não íntegra ou interromperá a alocação de controladores na instância.

Proteção contra encerramento e encerramento após a execução de etapas

Quando você habilita o encerramento após a execução da etapa e a proteção contra encerramento, o Amazon EMR ignora a proteção contra encerramento.

Ao enviar etapas para um cluster, você pode definir a propriedade ActionOnFailure para determinar o que acontecerá se não for possível executar a etapa devido a um erro. Os valores possíveis para essa configuração são TERMINATE_CLUSTER (TERMINATE_JOB_FLOW com versões anteriores) CANCEL_AND_WAIT e CONTINUE. Para ter mais informações, consulte Envio de trabalhos para um cluster do Amazon EMR.

Se ocorrer uma falha em uma etapa configurada com ActionOnFailure definida como CANCEL_AND_WAIT, se o encerramento após a execução da etapa estiver habilitado, o cluster será encerrado sem executar as etapas subsequentes.

Se ocorrer uma falha em uma etapa configurada com ActionOnFailure definida como TERMINATE_CLUSTER, use a tabela de configurações abaixo para determinar o resultado.

ActionOnFailure Encerramento após a execução da etapa Termination protection Resultado

TERMINATE_CLUSTER

Habilitado

Desabilitado

O cluster é encerrado

Habilitado

Habilitado

O cluster é encerrado

Desabilitado

Habilitado

O cluster continua

Desabilitado

Desabilitado

O cluster é encerrado

Proteção contra término e instâncias spot

A proteção contra término do Amazon EMR não impede que uma instância spot do Amazon EC2 seja terminada quando o preço spot ultrapassa o preço spot máximo.

Configurar a proteção contra término ao iniciar um cluster

Você pode habilitar ou desabilitar a proteção contra encerramento ao executar um cluster usando o console, a AWS CLI, ou a API.

Em clusters de nó único, as configurações padrão de proteção contra encerramento são as seguintes:

  • Inicialização de um cluster pelo console do Amazon EMR: a proteção contra encerramento está desabilitada por padrão.

  • Inicialização de um cluster por meio da AWS CLI aws emr create-cluster: a proteção contra encerramento está desabilitada, a menos que --termination-protected seja especificado.

  • Iniciar um cluster pelo comando RunJobFlow da API do Amazon EMR: a proteção contra encerramento é desabilitada, a menos que o valor booleano TerminationProtected seja definido como true.

Em clusters de alta disponibilidade, as configurações padrão de proteção contra encerramento são as seguintes:

  • Iniciar um cluster pelo console do Amazon EMR: a proteção contra encerramento é habilitada por padrão.

  • Inicialização de um cluster por meio da AWS CLI aws emr create-cluster: a proteção contra encerramento está desabilitada, a menos que --termination-protected seja especificado.

  • Iniciar um cluster pelo comando RunJobFlow da API do Amazon EMR: a proteção contra encerramento é desabilitada, a menos que o valor booleano TerminationProtected seja definido como true.

Console
Pata ativar ou desativar a proteção contra encerramento ao criar um cluster usando o console
  1. Faça login no AWS Management Console e abra o console do Amazon EMR em https://console.aws.amazon.com/emr.

  2. Em EMR no EC2, no painel de navegação esquerdo, escolha Clusters e depois Criar cluster.

  3. Em Versão do EMR, escolha emr-6.6.0 ou posterior.

  4. Em Encerramento do cluster e substituição do nó, verifique se a opção Usar proteção contra encerramento está pré-selecionada ou desmarque a seleção para desativá-la.

  5. Escolha qualquer outra opção que se aplique ao cluster.

  6. Para iniciar o cluster, escolha Criar cluster.

AWS CLI
Ativar ou desativar a proteção contra término ao criar um cluster usando a AWS CLI
  • Com a AWS CLI, você pode iniciar um cluster com proteção contra término habilitada, usando o comando create-cluster com o parâmetro --termination-protected. Por padrão, a proteção contra encerramento é desativada.

    O exemplo a seguir cria um cluster com proteção contra encerramento habilitada:

    nota

    Os caracteres de continuação de linha do Linux (\) são incluídos para facilitar a leitura. Eles podem ser removidos ou usados ​​em comandos do Linux. No Windows, remova-os ou substitua-os por um sinal de interpolação (^).

    aws emr create-cluster --name "TerminationProtectedCluster" --release-label emr-7.3.0 \ --applications Name=Hadoop Name=Hive Name=Pig \ --use-default-roles --ec2-attributes KeyName=myKey --instance-type m5.xlarge \ --instance-count 3 --termination-protected

    Para obter mais informações sobre o uso de comandos do Amazon EMR na AWS CLI, consulte https://docs.aws.amazon.com/cli/latest/reference/emr.

Configurar a proteção contra término para clusters em execução

Você pode configurar a proteção contra término para um cluster em execução usando o console ou a AWS CLI.

Console
Ativar ou desativar a proteção contra encerramento de um cluster em execução usando o console
  1. Faça login no AWS Management Console e abra o console do Amazon EMR em https://console.aws.amazon.com/emr.

  2. Em EMR no EC2 no painel de navegação esquerdo, escolha Clusters e selecione o cluster que você deseja atualizar.

  3. Na guia Propriedades na página de detalhes do cluster, localize Término do cluster e selecione Editar.

  4. Marque ou desmarque a caixa de seleção Usar proteção contra término para ativar ou desativar o atributo. Depois selecione Salvar alterações para confirmar.

AWS CLI
Ativar ou desativar a proteção contra término de um cluster em execução usando a AWS CLI
  • Para habilitar a proteção contra término em um cluster em execução usando a AWS CLI, digite o comando modify-cluster-attributes com o parâmetro --termination-protected. Para desabilitá-la, use o parâmetro --no-termination-protected.

    O exemplo a seguir habilita a proteção contra encerramento no cluster com o ID j-3KVTXXXXXX7UG:

    aws emr modify-cluster-attributes --cluster-id j-3KVTXXXXXX7UG --termination-protected

    O exemplo a seguir desabilita a proteção contra encerramento no mesmo cluster:

    aws emr modify-cluster-attributes --cluster-id j-3KVTXXXXXX7UG --no-termination-protected