Como configurar a classe de ambiente do Amazon MWAA - Amazon Managed Workflows for Apache Airflow

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Como configurar a classe de ambiente do Amazon MWAA

A classe de ambiente que você escolhe para seu ambiente Amazon MWAA determina o tamanho dos AWS Fargate contêineres AWS gerenciados nos quais o Celery Executor é executado e do banco de dados de metadados Amazon Aurora PostgreSQL gerenciado em que os AWS programadores do Apache Airflow criam instâncias de tarefas. Este tópico descreve cada classe de ambiente do Amazon MWAA e como atualizar a classe de ambiente no console do Amazon MWAA.

Funcionalidades do ambiente

A seção a seguir contém as tarefas simultâneas padrão do Apache Airflow, a Memória de Acesso Aleatório (RAM) e as unidades virtuais de processamento centralizado (vCPUs) para cada classe de ambiente. As tarefas simultâneas listadas pressupõem que a simultaneidade de tarefas não exceda a capacidade de operadores do Apache Airflow no ambiente.

Na tabela a seguir, a capacidade do DAG se refere às definições do DAG, não às execuções, e pressupõe que DAGs você seja dinâmico em um único arquivo Python e escrito com as melhores práticas do Apache Airflow.

As execuções de tarefas dependem de quantas são agendadas simultaneamente, pressupondo que o número de execuções do DAG definidas para iniciar ao mesmo tempo, não exceda o padrão max_dagruns_per_loop_to_schedule, bem como o tamanho e o número de operadores, conforme detalhado neste tópico.

mw1.micro
  • Capacidade de até 25 DAG

  • 3 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidor web: 1 vCPU, 3 GB de RAM

    • Trabalhador e programador: 1 vCPU, 3 GB de RAM

    • Banco de dados: 2 vCPUs, 4 GB de RAM

      nota

      mw1.micro não oferece suporte ao auto-scaling.

mw1.small
  • Até 50 DAG de capacidade

  • 5 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidores Web: 1 vCPU, 2 GB de RAM cada

    • Trabalhadores: 1 vCPU, 2 GB de RAM cada

    • Programadores: 1 vCPU, 2 GB de RAM cada

    • Banco de dados: 2 vCPUs, 4 GB de RAM

mw1.medium
  • Até 250 DAG de capacidade

  • 10 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidores Web: 1 vCPU, 2 GB de RAM cada

    • Trabalhadores: 2 vCPUs, 4 GB de RAM cada

    • Programadores: 2 vCPUs, 4 GB de RAM cada

    • Banco de dados: 2 vCPUs, 8 GB de RAM

mw1.large
  • Até 1000 DAG de capacidade

  • 20 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidores Web: 2 vCPUs, 4 GB de RAM cada

    • Trabalhadores: 4 vCPUs, 8 GB de RAM cada

    • Programadores: 4 vCPUs, 8 GB de RAM cada

    • Banco de dados: 2 vCPUs, 8 GB de RAM

mw1.xlarge
  • Até 2000 DAG de capacidade

  • 40 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidores Web: 4 vCPUs, 12 GB de RAM cada

    • Trabalhadores: 8 vCPUs, 24 GB de RAM cada

    • Programadores: 8 vCPUs, 24 GB de RAM cada

    • Banco de dados: 4 vCPUs, 32 GB de RAM

mw1.2xlarge
  • Até 4000 DAG de capacidade

  • 80 tarefas simultâneas (por padrão)

  • Componentes:

    • Servidores Web: 8 vCPUs, 24 GB de RAM cada

    • Trabalhadores: 16 vCPUs, 48 GB de RAM cada

    • Programadores: 16 vCPUs, 48 GB de RAM cada

    • Banco de dados: 8 vCPUs, 64 GB de RAM

Você pode usar celery.worker_autoscale para aumentar as tarefas por operador. Para obter mais informações, consulte Exemplo de caso de uso de alto desempenho.

Programadores do Apache Airflow

A seção a seguir contém as opções de programadores do Apache Airflow disponíveis no Amazon MWAA e como o número de programadores afeta o número de acionadores.

No Apache Airflow, um acionador gerencia tarefas que são adiadas até que certas condições especificadas usando um acionador sejam atendidas. No Amazon MWAA, o acionador é executado com o programador na mesma tarefa do Fargate. Aumentar a contagem de programadores aumenta correspondentemente o número de acionadores disponíveis, otimizando a forma como o ambiente gerencia tarefas adiadas. Isso garante o manuseio eficiente das tarefas, programando-as prontamente para serem executadas quando as condições forem atendidas.

Apache Airflow v2
  • v2 - Para ambientes maiores que mw1.micro, aceita valores de a. 2 5 O padrão é 2 para todos os tamanhos de ambiente, exceto mw1.micro, cujo padrão é. 1