Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Prácticas recomendadas para instancias de spot de Amazon EC2 para AWS Batch
Si elige las instancias de spot de Amazon Elastic Compute Cloud (EC2), es probable que pueda optimizar su flujo de trabajo para ahorrar costos, a veces de forma significativa. Para obtener más información, consulte Prácticas recomendadas de seguridad para Amazon EC2 Spot.
Para optimizar su flujo de trabajo y ahorrar costos, tenga en cuenta las siguientes prácticas recomendadas de Amazon EC2 Spot para AWS Batch:
-
Elija la estrategia de asignación de
SPOT_CAPACITY_OPTIMIZED
: AWS Batch elige las instancias de Amazon EC2 de los grupos de capacidad de Amazon EC2 Spot más amplios. Si le preocupan las interrupciones, esta es una opción adecuada. Para obtener más información, consulte Estrategias de asignación de tipos de instancia para AWS Batch. -
Diversifique los tipos de instancias: para diversificar sus tipos de instancias, considere tamaños y familias compatibles y, a continuación, deje que AWS Batch elija en función del precio o la disponibilidad. Por ejemplo, considere
c5.24xlarge
como una alternativa ac5.12xlarge
o a las familiasc5a
,c5n
,c5d
,m5
ym5d
. Para más información, consulte Ser flexible con respecto a los tipos de instancia y las zonas de disponibilidad. -
Reduzca el tiempo de ejecución o el punto de control de los trabajos: recomendamos no ejecutar trabajos que tarden una hora o más cuando se utilizan instancias de spot de Amazon EC2 para evitar interrupciones. Si divide o pone puntos de control a sus trabajos en partes más pequeñas de 30 minutos o menos, puede reducir considerablemente la posibilidad de interrupciones.
-
Utilice reintentos automatizados: para evitar interrupciones en los trabajos AWS Batch, configure los reintentos automatizados para los trabajos. Los trabajos por lotes pueden interrumpirse por cualquiera de los siguientes motivos: se devuelve un código de salida distinto de cero, se produce un error de servicio o se produce la recuperación de una instancia. Puede configurar hasta 10 reintentos automáticos. Para empezar, le recomendamos que establezca al menos de 1 a 3 reintentos automatizados. Para obtener información sobre el seguimiento de las interrupciones puntuales de Amazon EC2, consulte Avisos de interrupción de spot
. Para AWS Batch, si establece el parámetro de reintento, el trabajo se coloca al principio de la cola de trabajos. Es decir, se da prioridad al trabajo. Al crear la definición de trabajo o al enviar el trabajo en la AWS CLI, puede configurar una estrategia de reintento. Para obtener más información, consulte Enviar un trabajo.
$
aws batch submit-job --job-name MyJob \ --job-queue MyJQ \ --job-definition MyJD \ --retry-strategy attempts=2
-
Utilice reintentos personalizados: puede configurar una estrategia de reintento de trabajo para el código de salida de una aplicación específica o la recuperación de instancias. En el siguiente ejemplo, si el host provoca el error, se puede volver a intentar el trabajo hasta cinco veces. Sin embargo, si el trabajo falla por un motivo diferente, el trabajo se cierra y el estado se establece en
FAILED
."retryStrategy": { "attempts": 5, "evaluateOnExit": [{ "onStatusReason" :"Host EC2*", "action": "RETRY" },{ "onReason" : "*" "action": "EXIT" }] }
-
Utilice el panel de control de interrupciones puntuales: puede utilizar el panel de control de interrupciones puntuales para realizar un seguimiento de las interrupciones puntuales. La aplicación proporciona métricas sobre las instancias de spot de Amazon EC2 que se recuperan y las zonas de disponibilidad en las que se encuentran las instancias de spot. Para obtener más información, consulte Interrupciones de instancias de spot
.