Configuración de la clase de MWAA entorno Amazon - Amazon Managed Workflows para Apache Airflow

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración de la clase de MWAA entorno Amazon

La clase de entorno que elija para su MWAA entorno de Amazon determina el tamaño de los AWS Fargate contenedores AWS gestionados en los que se ejecuta Celery Executor y de la base de datos de SQL metadatos Amazon AWS Aurora Postgre gestionada, en la que los programadores de Apache Airflow crean instancias de tareas. En este tema se describe cada clase de MWAA entorno de Amazon y cómo actualizar la clase de entorno en la MWAA consola de Amazon.

Capacidades del entorno

La siguiente sección contiene las tareas simultáneas predeterminadas de Apache Airflow, la memoria de acceso aleatorio (RAM) y las unidades de procesamiento centralizado virtuales (vCPUs) para cada clase de entorno. Las tareas simultáneas enumeradas suponen que la simultaneidad de las tareas no supera la capacidad de procesamiento de trabajo de Apache Airflow en el entorno.

En la siguiente tabla, la DAG capacidad se refiere a DAG las definiciones, no a las ejecuciones, y supone que DAGs eres dinámico en un único archivo de Python y que estás escrito con las mejores prácticas de Apache Airflow.

Las ejecuciones de tareas dependen del número de ejecuciones programadas simultáneamente y se parte del supuesto de que el número de DAG ejecuciones programadas para que comiencen al mismo tiempo no supere el valor predeterminado max_dagruns_per_loop_to_schedule, así como el tamaño y la cantidad de trabajadores, tal como se detalla en este tema.

mw1.micro
  • DAGCapacidad máxima de 25

  • 3 tareas simultáneas (de forma predeterminada)

  • Componentes:

    • Servidor web: 1 vCPU, 3 GB RAM

    • Trabajador y planificador: 1 vCPU, 3 GB RAM

    • Base de datos: 2 vCPU, 4 GB RAM

      nota

      mw1.micro no admite el autoescalado.

mw1.small
  • Hasta un 50% de capacidad DAG

  • 5 tareas simultáneas (de forma predeterminada)

  • Componentes

    • Servidores web: 1 vCPU, 2 GB cada uno RAM

    • Trabajadores: 1 vCPU, 2 GB cada uno RAM

    • Programadores: 1 vCPU, 2 GB cada uno RAM

    • Base de datos: 2 v, 4 GB CPU RAM

mw1.medium
  • Capacidad de hasta 250 DAG

  • 10 tareas simultáneas (de forma predeterminada)

  • Componentes:

    • Servidores web: 1 v CPU 2 GB cada uno RAM

    • Trabajadores: 2 contra CPU 4 GB cada uno RAM

    • Programadores: 2 contra 4 GB cada uno CPU RAM

    • Base de datos: 2 contra 8 GB CPU RAM

mw1.large
  • Capacidad de hasta 1000 DAG

  • 20 tareas simultáneas (de forma predeterminada)

  • Componentes:

    • Servidores web: 2 contra CPU 4 GB cada uno RAM

    • Trabajadores: 4 contra CPU 8 GB cada uno RAM

    • Programadores: 4 contra 8 GB cada uno CPU RAM

    • Base de datos: 2 contra 8 GB CPU RAM

mw1.xlarge
  • Capacidad de hasta 2000 DAG

  • 40 tareas simultáneas (de forma predeterminada)

  • Componentes:

    • Servidores web: 4 contra CPU 12 GB cada uno RAM

    • Trabajadores: 8 contra CPU 24 GB cada uno RAM

    • Programadores: 8 contra 24 GB cada uno CPU RAM

    • Base de datos: 4 contra 32 GB CPU RAM

mw1.2xlarge
  • Capacidad de hasta 4000 DAG

  • 80 tareas simultáneas (de forma predeterminada)

  • Componentes:

    • Servidores web: 8 V y CPU 24 GB cada uno RAM

    • Trabajadores: 16 contra CPU 48 GB cada uno RAM

    • Programadores: 16 contra 48 GB cada uno CPU RAM

    • Base de datos: 8 contra 64 GB CPU RAM

Se puede utilizar celery.worker_autoscale para aumentar las tareas por proceso de trabajo. Para obtener más información, consulte Ejemplo de caso de uso de alto rendimiento.

Programadores de Apache Airflow

La siguiente sección contiene las opciones del programador de Apache Airflow disponibles en Amazon MWAA y cómo la cantidad de programadores afecta a la cantidad de activadores.

En Apache Airflow, un desencadenador administra las tareas y las aplaza hasta que se cumplen determinadas condiciones especificadas mediante un desencadenador. En Amazon, MWAA el activador se ejecuta junto con el programador en la misma tarea de Fargate. Al aumentar el número de programadores, se aumenta, en consecuencia, el número de desencadenadores disponibles, lo que optimiza la forma en que el entorno administra las tareas aplazadas. Esto garantiza una administración eficiente de las tareas, programándolas rápidamente para que se ejecuten cuando se cumplan las condiciones.

Apache Airflow v2
  • v2: para entornos con un tamaño superior a mw1.micro, acepta valores comprendidos entre y. 2 5 El valor predeterminado es 2 para todos los tamaños de entorno, excepto mw1.micro, que de forma predeterminada es. 1