Uso de la protección de finalización para proteger sus clústeres de Amazon EMR de un cierre accidental
La protección de finalización protege sus clústeres de la finalización accidental, lo que puede resultar especialmente útil para clústeres de larga ejecución que procesan cargas de trabajo críticas. Si la protección de terminación está habilitada en un clúster de ejecución prolongada, puede seguir terminando el clúster, pero primero debe quitar de forma explícita la protección de terminación de este. Esto ayuda a garantizar que las instancias EC2 no se cierren por accidente o por error. Puede habilitar la protección de terminación al crear un clúster y también cambiar este ajuste en un clúster en ejecución.
Con la protección de terminación habilitada, la acción TerminateJobFlows
de la API de Amazon EMR no funciona. Los usuarios no pueden terminar el clúster con esta API ni con el comando terminate-clusters
desde la AWS CLI. La API devuelve un error y la CLI se cierra con un código de devolución distinto de cero. Cuando utilice la consola de Amazon EMR para terminar un clúster, se le pedirá que realice un paso adicional para desactivar la protección de terminación.
aviso
La protección contra la terminación no garantiza que los datos se conserven en caso de un error humano o de una solución alternativa; por ejemplo, si se emite un comando de reinicio desde la línea de comandos mientras se está conectado a la instancia mediante SSH, si una aplicación o un script que se ejecuta en la instancia emite un comando de reinicio o si se utiliza la API de Amazon EC2 o de Amazon EMR para deshabilitar la protección contra la terminación. Esto también es cierto si está ejecutando la versión 7.1 y posteriores de Amazon EMR y una instancia deja de estar en buen estado y es irrecuperable. Incluso con la protección contra la terminación habilitada, los datos guardados en el almacenamiento de instancias, incluidos los datos del HDFS, se pueden perder. Escriba salidas de datos en las ubicaciones de Amazon S3 y cree estrategias de copia de seguridad adecuadas para sus requisitos de continuidad empresarial.
La protección de terminación no afecta a la capacidad para escalar los recursos del clúster con cualquiera de las siguientes acciones:
-
Cambiar manualmente el tamaño de un clúster con la AWS Management Console o la AWS CLI. Para obtener más información, consulte Cambio manual del tamaño de un clúster de Amazon EMR en ejecución.
-
Eliminar instancias de un grupo de instancias secundarias o de tareas mediante una política de escalado descendente con escalado automático. Para obtener más información, consulte Uso del escalado automático con una política personalizada para grupos de instancias en Amazon EMR.
-
Eliminar instancias de una flota de instancias reduciendo la capacidad de destino. Para obtener más información, consulte Opciones de flota de instancias.
Protección contra la terminación y Amazon EC2
La configuración de protección de finalización en un clúster de Amazon EMR corresponde al atributo DisableApiTermination
para todas las instancias de Amazon EC2 en el clúster. Por ejemplo, si habilita la protección de finalización en un clúster de EMR, Amazon EMR establece automáticamente DisableApiTermination
en verdadero para todas las instancias EC2 del clúster de EMR. Lo mismo se aplica si deshabilita la protección de finalización. Amazon EMR establece automáticamente DisableApiTermination
en falso para todas las instancias de EC2 del clúster de EMR. Si finaliza o reduce verticalmente un clúster de Amazon EMR y la configuración de Amazon EC2 entra en conflicto para una instancia de EC2, Amazon EMR prioriza la configuración de Amazon EMR sobre las configuraciones de DisableApiStop
y DisableApiTermination
en Amazon EC2 y continúa finalizando la instancia de EC2.
Por ejemplo, puede usar la consola Amazon EC2 para habilitar la protección de finalización en una instancia de Amazon EC2 en un clúster EMR con la protección de finalización deshabilitada. Si finaliza o reduce verticalmente el clúster con la consola de Amazon EMR, la AWS CLI o la API de Amazon EMR, Amazon EMR anula la configuración de DisableApiTermination
, la establece en “false” y finaliza la instancia junto con las demás instancias.
Puede usar también la consola Amazon EC2 para habilitar la protección de detención en una instancia de Amazon EC2 en un clúster EMR con la protección de finalización deshabilitada. Si finaliza o reduce verticalmente el clúster, Amazon EMR establece DisableApiStop
en “false” en Amazon EC2 y finaliza la instancia junto con las demás instancias.
Amazon EMR anula la configuración de DisableApiStop
solo cuando se finaliza o se reduce verticalmente un clúster. Al habilitar o deshabilitar la protección de finalización en un clúster de EMR, Amazon EMR no cambia la configuración de disableApiStop
para ninguna de las instancias de EC2 del clúster de EMR correspondiente.
importante
Si crea una instancia como parte de un clúster de Amazon EMR con la protección de finalización y se utiliza la API de Amazon EC2 o los comandos de la AWS CLI para modificar dicha instancia de forma que DisableApiTermination
sea false
y, a continuación, la API de Amazon EC2 o los comandos de la AWS CLI ejecutan la operación TerminateInstances
, la instancia de Amazon EC2 finaliza.
Protección de terminación y nodos de YARN en mal estado
Amazon EMR comprueba periódicamente el estado de Apache Hadoop YARN de los nodos que se ejecutan en las instancias de Amazon EC2 básicas y de tareas de un clúster. El estado se notifica mediante el servicio de comprobación de estado NodeManagerUNHEALTHY
, el controlador de instancias de Amazon EMR lo agrega a la lista de denegación y no le asigna contenedores YARN hasta que vuelva a estar en buen estado. Según los estados de la protección de finalización, el reemplazo de nodos en mal estado y la versión de lanzamiento de Amazon EMR, Amazon EMR reemplazará la instancia en mal estado o dejará de asignar controladores a la instancia.
Protección de finalización y finalización tras la ejecución de pasos
Cuando habilita la finalización tras la ejecución de pasos y también habilita la protección de finalización, Amazon EMR ignora la protección de finalización.
Al enviar pasos a un clúster, puede establecer la propiedad ActionOnFailure
para determinar qué sucede si el paso no puede completar su ejecución debido a un error. Los valores posibles para esta propiedad son TERMINATE_CLUSTER
(TERMINATE_JOB_FLOW
con versiones anteriores), CANCEL_AND_WAIT
y CONTINUE
. Para obtener más información, consulte Envío del trabajo a un clúster de Amazon EMR.
Si se produce un error en un paso que se ha configurado con el valor ActionOnFailure
en CANCEL_AND_WAIT
, y la ejecución de pasos se ha habilitado, el clúster finaliza sin ejecutar los pasos siguientes.
Si se produce un error en un paso que tiene la propiedad ActionOnFailure
establecida en TERMINATE_CLUSTER
, utilice la tabla de configuración mostrada a continuación para determinar el resultado.
ActionOnFailure | Finalización después de la ejecución de pasos | Protección de finalización | Resultado |
---|---|---|---|
|
Habilitado |
Deshabilitad |
El clúster termina |
Habilitado |
Habilitado |
El clúster termina |
|
Deshabilitad |
Habilitado |
El clúster continúa |
|
Deshabilitad |
Deshabilitad |
El clúster termina |
Protección de terminación e instancias de spot
La protección de terminación de Amazon EMR no impide que una instancia de spot de Amazon EC2 termine cuando el precio de spot supera el precio de spot máximo.
Configuración de la protección de terminación al lanzar un clúster
Puede habilitar o deshabilitar la protección de terminación al lanzar un clúster con la consola, la AWS CLI o la API.
Para los clústeres de un solo nodo, la configuración de protección de finalización predeterminada es la siguiente:
-
Lanzamiento de un clúster mediante la consola Amazon EMR: la protección de finalización está deshabilitada de forma predeterminada.
-
Lanzamiento de un clúster mediante la AWS CLI
aws emr create-cluster
: la protección de finalización está deshabilitada a menos que se especifique--termination-protected
. -
Lanzamiento de un clúster mediante el comando RunJobFlow de la API de Amazon EMR: la protección de finalización está deshabilitada a menos que el valor booleano
TerminationProtected
esté establecido entrue
.
Para los clústeres de alta disponibilidad, la configuración de protección de finalización predeterminada es la siguiente:
-
Lanzamiento de un clúster mediante la consola de Amazon EMR: la protección de finalización está habilitada de forma predeterminada.
-
Lanzamiento de un clúster mediante la AWS CLI
aws emr create-cluster
: la protección de finalización está deshabilitada a menos que se especifique--termination-protected
. -
Lanzamiento de un clúster mediante el comando RunJobFlow de la API de Amazon EMR: la protección de finalización está deshabilitada a menos que el valor booleano
TerminationProtected
esté establecido entrue
.
Configuración de la protección de terminación para ejecutar clústeres
Puede configurar la protección de terminación para un clúster en ejecución utilizando la consola o la AWS CLI.