Configurando a classe de MWAA ambiente Amazon - Amazon Managed Workflows for Apache Airflow

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Configurando a classe de MWAA ambiente Amazon

A classe de ambiente que você escolhe para seu MWAA ambiente Amazon determina o tamanho dos AWS Fargate contêineres AWS gerenciados nos quais o Celery Executor é executado e do banco de dados de metadados gerenciado do AWS Amazon Aurora SQL Postgre, no qual os programadores do Apache Airflow criam instâncias de tarefas. Este tópico descreve cada classe de MWAA ambiente da Amazon e como atualizar a classe de ambiente no MWAA console da Amazon.

Funcionalidades do ambiente

A seção a seguir contém as tarefas simultâneas padrão do Apache Airflow, a Memória de Acesso Aleatório (RAM) e as unidades virtuais de processamento centralizado (vCPUs) para cada classe de ambiente. As tarefas simultâneas listadas pressupõem que a simultaneidade de tarefas não exceda a capacidade de operadores do Apache Airflow no ambiente.

Na tabela a seguir, a DAG capacidade se refere às DAG definições, não às execuções, e pressupõe que DAGs você seja dinâmico em um único arquivo Python e escrito com as melhores práticas do Apache Airflow.

As execuções de tarefas dependem de quantas são agendadas simultaneamente e pressupõe que o número de DAG execuções definidas para iniciar ao mesmo tempo não exceda o padrão max_dagruns_per_loop_to_schedule, bem como o tamanho e o número de trabalhadores, conforme detalhado neste tópico.

mw1.micro
  • DAGCapacidade de até 25

  • 3 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidor web: 1 vCPU, 3 GB RAM

    • Trabalhador e programador: 1 vCPU, 3 GB RAM

    • Banco de dados: 2 vCPU, 4 GB RAM

      nota

      mw1.micro não oferece suporte ao auto-scaling.

mw1.small
  • DAGCapacidade de até 50

  • 5 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidores web: 1 vCPU, 2 GB cada RAM

    • Trabalhadores: 1 vCPU, 2 GB cada RAM

    • Agendadores: 1 vCPU, 2 GB cada RAM

    • Banco de dados: 2 vCPU, 4 GB RAM

mw1.medium
  • DAGCapacidade de até 250

  • 10 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidores web: 1 v CPU 2GB cada RAM

    • Trabalhadores: 2 x CPU 4 GB cada RAM

    • Agendadores: 2 x CPU 4 GB cada RAM

    • Banco de dados: 2 v CPU 8GB RAM

mw1.large
  • DAGCapacidade de até 1000

  • 20 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidores web: 2 x CPU 4 GB cada RAM

    • Trabalhadores: 4 x CPU 8 GB cada RAM

    • Agendadores: 4 x CPU 8 GB cada RAM

    • Banco de dados: 2 v CPU 8GB RAM

mw1.xlarge
  • DAGCapacidade de até 2000

  • 40 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidores web: 4 x CPU 12 GB cada RAM

    • Trabalhadores: 8 x CPU 24 GB cada RAM

    • Agendadores: 8 x CPU 24 GB cada RAM

    • Banco de dados: 4 v CPU 32GB RAM

mw1.2xlarge
  • DAGCapacidade de até 4000

  • 80 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidores web: 8 x CPU 24 GB cada RAM

    • Trabalhadores: 16 x CPU 48 GB cada RAM

    • Agendadores: 16 x CPU 48 GB cada RAM

    • Banco de dados: 8 v CPU 64GB RAM

Você pode usar celery.worker_autoscale para aumentar as tarefas por operador. Para obter mais informações, consulte Exemplo de caso de uso de alto desempenho.

Programadores do Apache Airflow

A seção a seguir contém as opções do agendador Apache Airflow disponíveis na Amazon MWAA e como o número de agendadores afeta o número de acionadores.

No Apache Airflow, um acionador gerencia tarefas que são adiadas até que certas condições especificadas usando um acionador sejam atendidas. Na Amazon, MWAA o acionador é executado junto com o agendador na mesma tarefa do Fargate. Aumentar a contagem de programadores aumenta correspondentemente o número de acionadores disponíveis, otimizando a forma como o ambiente gerencia tarefas adiadas. Isso garante o manuseio eficiente das tarefas, programando-as prontamente para serem executadas quando as condições forem atendidas.

Apache Airflow v2
  • v2 - Para ambientes maiores que mw1.micro, aceita valores de a. 2 5 O padrão é 2 para todos os tamanhos de ambiente, exceto mw1.micro, cujo padrão é. 1