Configurazione della classe di MWAA ambiente Amazon - Amazon Managed Workflows for Apache Airflow

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Configurazione della classe di MWAA ambiente Amazon

La classe di ambiente scelta per il tuo MWAA ambiente Amazon determina la dimensione dei AWS Fargate contenitori AWS gestiti su cui viene eseguito Celery Executor e del database di metadati AWS Amazon Aurora SQL Postgre gestito in cui gli scheduler Apache Airflow creano istanze di attività. Questo argomento descrive ogni classe di MWAA ambiente Amazon e come aggiornare la classe di ambiente sulla MWAA console Amazon.

Funzionalità ambientali

La sezione seguente contiene le attività simultanee predefinite di Apache Airflow, Random Access Memory (RAM) e le unità di elaborazione centralizzate virtuali (vCPUs) per ogni classe di ambiente. Le attività simultanee elencate presuppongono che la concorrenza delle attività non superi la capacità di Apache Airflow Worker nell'ambiente.

Nella tabella seguente, la DAG capacità si riferisce alle DAG definizioni, non alle esecuzioni, e presuppone che l'utente sia dinamico in un DAGs singolo file Python e scritto con le best practice di Apache Airflow.

Le esecuzioni delle attività dipendono dal numero di operazioni pianificate contemporaneamente e presuppongono che il numero di DAG esecuzioni impostate per l'avvio nello stesso momento non superi il valore predefinito max_dagruns_per_loop_to_schedule, nonché le dimensioni e il numero di lavoratori, come descritto in questo argomento.

mw1.micro
  • Fino a 25 capacità DAG

  • 3 attività simultanee (per impostazione predefinita)

  • Componenti:

    • Server Web: 1 vCPU, 3 GB RAM

    • Lavoratore e programmatore: 1 vCPU, 3 GB RAM

    • Database: 2 vCPU, 4 GB RAM

      Nota

      mw1.micro non supporta l'auto-scaling.

mw1.small
  • Fino al 50% di capacità DAG

  • 5 attività simultanee (per impostazione predefinita)

  • Componenti:

    • Server Web: 1 vCPU, 2 GB ciascuno RAM

    • Lavoratori: 1 vCPU, 2 GB ciascuno RAM

    • Scheduler: 1 vCPU, 2 GB ciascuno RAM

    • Database: 2 vCPU, 4 GB RAM

mw1.medium
  • Fino a 250 capacità DAG

  • 10 attività simultanee (per impostazione predefinita)

  • Componenti:

    • Server Web: 1 x CPU 2 GB ciascuno RAM

    • Lavoratori: 2 x CPU 4 GB ciascuno RAM

    • Scheduler: 2 x 4 GB ciascuno CPU RAM

    • Database: 2 v 8 GB CPU RAM

mw1.large
  • Fino a 1000 capacità DAG

  • 20 attività simultanee (per impostazione predefinita)

  • Componenti:

    • Server Web: 2 v CPU 4 GB ciascuno RAM

    • Lavoratori: 4 x CPU 8 GB ciascuno RAM

    • Scheduler: 4 x 8 GB ciascuno CPU RAM

    • Database: 2 v 8 GB CPU RAM

mw1.xlarge
  • Fino a 2000 capacità DAG

  • 40 attività simultanee (per impostazione predefinita)

  • Componenti:

    • Server Web: 4 v CPU 12 GB ciascuno RAM

    • Lavoratori: 8 v CPU 24 GB ciascuno RAM

    • Scheduler: 8 v 24 GB ciascuno CPU RAM

    • Database: 4 v 32 GB CPU RAM

mw1.2xlarge
  • Fino a 4000 capacità DAG

  • 80 attività simultanee (per impostazione predefinita)

  • Componenti:

    • Server Web: 8 v 24 GB ciascuno CPU RAM

    • Lavoratori: 16 v CPU 48 GB ciascuno RAM

    • Scheduler: 16 v 48 GB ciascuno CPU RAM

    • Database: 8 v 64 GB CPU RAM

È possibile utilizzare celery.worker_autoscale per aumentare le attività per lavoratore. Per ulteriori informazioni, consulta la Esempio di utilizzo ad alte prestazioni.

Apache Airflow Scheduler

La sezione seguente contiene le opzioni di pianificazione di Apache Airflow disponibili su Amazon MWAA e il modo in cui il numero di scheduler influisce sul numero di trigger.

In Apache Airflow, un trigger gestisce le attività che rimanda fino a quando non vengono soddisfatte determinate condizioni specificate utilizzando un trigger. In Amazon, MWAA il trigger viene eseguito insieme allo scheduler per la stessa attività di Fargate. L'aumento del numero di pianificatori aumenta di conseguenza il numero di trigger disponibili, ottimizzando il modo in cui l'ambiente gestisce le attività differite. Ciò garantisce una gestione efficiente delle attività, pianificandone tempestivamente l'esecuzione quando le condizioni sono soddisfatte.

Apache Airflow v2
  • v2 - Per ambienti più grandi di mw1.micro, accetta valori da a. 2 5 Il valore predefinito è 2 per tutte le dimensioni degli ambienti tranne mw1.micro, che per impostazione predefinita è. 1