Configuración de la clase de entorno Amazon MWAA - Amazon Managed Workflows para Apache Airflow

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Configuración de la clase de entorno Amazon MWAA

La clase de entorno que elija para su entorno Amazon MWAA determinará el tamaño de los AWS Fargate contenedores AWS gestionados en los que se ejecuta Celery Executor y de la base de datos de metadatos Amazon AWS Aurora PostgreSQL gestionada en la que los programadores de Apache Airflow crean instancias de tareas. En este tema se describe cada clase de entorno de Amazon MWAA y cómo actualizar la clase de entorno en la consola de Amazon MWAA.

Capacidades del entorno

La siguiente sección contiene las tareas simultáneas predeterminadas de Apache Airflow, la memoria de acceso aleatorio (RAM) y las unidades de procesamiento centralizado virtuales (vCPUs) para cada clase de entorno. Las tareas simultáneas enumeradas suponen que la simultaneidad de las tareas no supera la capacidad de procesamiento de trabajo de Apache Airflow en el entorno.

En la siguiente tabla, la capacidad del DAG se refiere a las definiciones del DAG, no a las ejecuciones, y supone que DAGs usted es dinámico en un solo archivo de Python y está escrito con las mejores prácticas de Apache Airflow.

Las ejecuciones de tareas dependen del número de tareas programadas simultáneamente y se parte del supuesto de que el número de ejecuciones de DAG programadas para que comiencen al mismo tiempo no supere el valor predeterminado de max_dagruns_per_loop_to_schedule, así como el tamaño y la cantidad de procesos de trabajo, tal como se detalla en este tema.

mw1.micro
  • Capacidad de hasta 25 DAG

  • 3 tareas simultáneas (de forma predeterminada)

  • Componentes:

    • Servidor web: 1 vCPU, 3 GB de RAM

    • Trabajador y programador: 1 vCPU, 3 GB de RAM

    • Base de datos: 2 vCPU, 4 GB de RAM

      nota

      mw1.micro no admite el autoescalado.

mw1.small
  • Capacidad de hasta 50 DAG

  • 5 tareas simultáneas (de forma predeterminada)

  • Componentes

    • Servidores web: 1 vCPU, 2 GB de RAM cada uno

    • Procesos de trabajo: 1 vCPU, 2 GB de RAM cada uno

    • Programadores: 1 vCPU, 2 GB de RAM cada uno

    • Base de datos: 2 vCPU, 4 GB de RAM

mw1.medium
  • Capacidad de hasta 250 DAG

  • 10 tareas simultáneas (de forma predeterminada)

  • Componentes:

    • Servidores web: 1 vCPU de 2 GB de RAM cada uno

    • Procesos de trabajo: 2 vCPU de 4 GB de RAM cada uno

    • Programadores: 2 vCPU de 4 GB de RAM cada uno

    • Base de datos: 2 vCPU de 8 GB de RAM

mw1.large
  • Capacidad de hasta 1000 DAG

  • 20 tareas simultáneas (de forma predeterminada)

  • Componentes:

    • Servidores web: 2 vCPU de 4 GB de RAM cada uno

    • Procesos de trabajo: 4 vCPU de 8 GB de RAM cada uno

    • Programadores: 4 vCPU de 8 GB de RAM cada uno

    • Base de datos: 2 vCPU de 8 GB de RAM

mw1.xlarge
  • Capacidad de hasta 2000 DAG

  • 40 tareas simultáneas (de forma predeterminada)

  • Componentes:

    • Servidores web: 4 vCPU de 12 GB de RAM cada uno

    • Procesos de trabajo: 8 vCPU de 24 GB de RAM cada uno

    • Programadores: 8 vCPU de 24 GB de RAM cada uno

    • Base de datos: 4 vCPU de 32 GB de RAM

mw1.2xlarge
  • Capacidad de hasta 4000 DAG

  • 80 tareas simultáneas (de forma predeterminada)

  • Componentes:

    • Servidores web: 8 vCPU de 24 GB de RAM cada uno

    • Procesos de trabajo: 16 vCPU de 48 GB de RAM cada uno

    • Programadores: 16 vCPU de 48 GB de RAM cada uno

    • Base de datos: 8 vCPU de 64 GB de RAM

Se puede utilizar celery.worker_autoscale para aumentar las tareas por proceso de trabajo. Para obtener más información, consulte Ejemplo de caso de uso de alto rendimiento.

Programadores de Apache Airflow

La siguiente sección contiene las opciones de programadores de Apache Airflow disponibles en Amazon MWAA y de qué modo el número de programadores afecta al número de desencadenadores.

En Apache Airflow, un desencadenador administra las tareas y las aplaza hasta que se cumplen determinadas condiciones especificadas mediante un desencadenador. En Amazon MWAA, el desencadenador se ejecuta junto con el programador en la misma tarea de Fargate. Al aumentar el número de programadores, se aumenta, en consecuencia, el número de desencadenadores disponibles, lo que optimiza la forma en que el entorno administra las tareas aplazadas. Esto garantiza una administración eficiente de las tareas, programándolas rápidamente para que se ejecuten cuando se cumplan las condiciones.

Apache Airflow v2
  • v2: para entornos con un tamaño superior a mw1.micro, acepta valores comprendidos entre y. 2 5 El valor predeterminado es 2 para todos los tamaños de entorno, excepto mw1.micro, que de forma predeterminada es. 1