Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation des options de configuration d'Apache Airflow sur Amazon MWAA
Les options de configuration d'Apache Airflow peuvent être associées à votre environnement Amazon Managed Workflows for Apache Airflow en tant que variables d'environnement. Vous pouvez choisir dans la liste déroulante suggérée ou spécifier des options de configuration personnalisées pour votre version d'Apache Airflow sur la console AmazonMWAA. Cette rubrique décrit les options de configuration d'Apache Airflow disponibles et explique comment les utiliser pour remplacer les paramètres de configuration d'Apache Airflow dans votre environnement.
Table des matières
Prérequis
Vous aurez besoin des éléments suivants avant de pouvoir effectuer les étapes indiquées sur cette page.
-
Autorisations — Votre AWS compte doit avoir été autorisé par votre administrateur à accéder à la politique de contrôle d'mazonMWAAFullConsoleAccessaccès A pour votre environnement. En outre, votre MWAA environnement Amazon doit être autorisé par votre rôle d'exécution à accéder aux AWS ressources utilisées par votre environnement.
-
Accès : si vous devez accéder à des référentiels publics pour installer des dépendances directement sur le serveur Web, votre environnement doit être configuré avec un accès au serveur Web du réseau public. Pour de plus amples informations, veuillez consulter Modes d'accès à Apache Airflow.
-
Configuration Amazon S3 — Le compartiment Amazon S3 utilisé pour stocker vos DAGs plugins personnalisés et vos dépendances Python
requirements.txt
doit être configuré avec l'accès public bloqué et le versionnage activé.plugins.zip
Comment ça marche
Lorsque vous créez un environnement, Amazon MWAA joint les paramètres de configuration que vous spécifiez sur la MWAA console Amazon dans les options de configuration d'Airflow en tant que variables d'environnement au AWS Fargate conteneur de votre environnement. Si vous utilisez un paramètre du même nom dansairflow.cfg
, les options que vous spécifiez sur la MWAA console Amazon remplacent les valeurs dansairflow.cfg
.
Bien que nous ne les exposons pas airflow.cfg
dans l'interface utilisateur Apache Airflow d'un MWAA environnement Amazon par défaut, vous pouvez modifier les options de configuration d'Apache Airflow directement sur la MWAA console Amazon, y compris les paramètres permettant webserver.expose_config
d'exposer les configurations.
Utilisation des options de configuration pour charger des plugins dans Apache Airflow v2
Par défaut, dans Apache Airflow v2, les plugins sont configurés pour être chargés « paresseusement » à l'core.lazy_load_plugins : True
aide de ce paramètre. Si vous utilisez des plugins personnalisés dans Apache Airflow v2, vous devez les ajouter en core.lazy_load_plugins : False
tant qu'option de configuration d'Apache Airflow pour charger les plugins au début de chaque processus Airflow afin de remplacer le paramètre par défaut.
Vue d'ensemble des options de configuration
Lorsque vous ajoutez une configuration sur la MWAA console Amazon, Amazon MWAA écrit la configuration sous forme de variable d'environnement.
-
Options répertoriées. Vous pouvez choisir l'un des paramètres de configuration disponibles pour votre version d'Apache Airflow dans la liste déroulante. Par exemple,
dag_concurrency
:16
. Le paramètre de configuration est traduit dans le conteneur Fargate de votre environnement sous la formeAIRFLOW__CORE__DAG_CONCURRENCY : 16
-
Options personnalisées. Vous pouvez également spécifier des options de configuration Airflow qui ne sont pas répertoriées pour votre version d'Apache Airflow dans la liste déroulante. Par exemple,
foo.user
:YOUR_USER_NAME
. Le paramètre de configuration est traduit dans le conteneur Fargate de votre environnement sous la formeAIRFLOW__FOO__USER : YOUR_USER_NAME
Options de configuration d'Apache Airflow
L'image suivante montre où vous pouvez personnaliser les options de configuration d'Apache Airflow sur la MWAA console Amazon.
Référence Apache Airflow
Pour obtenir la liste des options de configuration prises en charge par Apache Airflow, consultez la section Référence de configuration
Utilisation de la MWAA console Amazon
La procédure suivante explique les étapes à suivre pour ajouter une option de configuration Airflow à votre environnement.
-
Ouvrez la page Environnements
sur la MWAA console Amazon. -
Choisissez un environnement.
-
Choisissez Modifier.
-
Choisissez Suivant.
-
Choisissez Ajouter une configuration personnalisée dans le volet des options de configuration d'Airflow.
-
Choisissez une configuration dans la liste déroulante et entrez une valeur, ou saisissez une configuration personnalisée et entrez une valeur.
-
Choisissez Ajouter une configuration personnalisée pour chaque configuration que vous souhaitez ajouter.
-
Choisissez Save (Enregistrer).
Référence de configuration
La section suivante contient la liste des configurations Apache Airflow disponibles dans la liste déroulante de la console AmazonMWAA.
Configurations des e-mails
La liste suivante présente les options de configuration des notifications par e-mail Airflow disponibles sur AmazonMWAA.
Nous vous recommandons d'utiliser le port 587 pour le SMTP trafic. AWS Bloque par défaut le SMTP trafic sortant sur le port 25 de toutes les EC2 instances Amazon. Si vous souhaitez envoyer du trafic sortant sur le port 25, vous pouvez demander la suppression de cette restriction
Configurations des tâches
La liste suivante présente les configurations disponibles dans la liste déroulante pour les tâches Airflow sur Amazon. MWAA
Configurations du planificateur
La liste suivante présente les configurations du planificateur Apache Airflow disponibles dans la liste déroulante sur Amazon. MWAA
Configurations des travailleurs
La liste suivante présente les configurations de travail Airflow disponibles dans la liste déroulante d'Amazon. MWAA
Configurations du serveur Web
La liste suivante présente les configurations du serveur Web Airflow disponibles dans la liste déroulante d'Amazon. MWAA
Configurations du déclencheur
La liste suivante présente les configurations du déclencheur
Exemples et exemple de code
Exemple DAG
Vous pouvez utiliser ce qui suit DAG pour imprimer vos options de configuration email_backend
Apache Airflow. Pour l'exécuter en réponse à MWAA des événements Amazon, copiez le code dans le DAGs dossier de votre environnement sur votre compartiment de stockage Amazon S3.
from airflow.decorators import dag from datetime import datetime def print_var(**kwargs): email_backend = kwargs['conf'].get(section='email', key='email_backend') print("email_backend") return email_backend @dag( dag_id="print_env_variable_example", schedule_interval=None, start_date=datetime(
yyyy
,m
,d
), catchup=False, ) def print_variable_dag(): email_backend_test = PythonOperator( task_id="email_backend_test", python_callable=print_var, provide_context=True ) print_variable_test = print_variable_dag()
Exemples de paramètres de notification par e-mail
Les options de configuration Apache Airflow suivantes peuvent être utilisées pour un compte de messagerie Gmail.com à l'aide d'un mot de passe d'application. Pour plus d'informations, consultez la section Se connecter à l'aide des mots de passe des applications
Quelle est la prochaine étape ?
-
Découvrez comment charger votre DAG dossier dans votre compartiment Amazon S3 dansAjouter ou mettre à jour DAGs.