기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon MWAA에서 Apache Airflow 구성 옵션 사용
Apache Airflow 구성 옵션은 Amazon Managed Workflows for Apache Airflow 환경에 환경 변수로 연결할 수 있습니다. 제안된 드롭다운 목록에서 선택하거나 Amazon MWAA 콘솔에서 Apache Airflow 버전의 사용자 지정 구성 옵션을 지정할 수 있습니다. 이 페이지에서는 사용 가능한 Apache Airflow 구성 옵션과 이러한 옵션을 사용하여 사용자 환경의 Apache Airflow 구성 설정을 재정의하는 방법을 설명합니다.
목차
필수 조건
이 페이지의 단계를 완료하려면 먼저 다음이 필요합니다.
-
권한 — 관리자는 사용자 환경에 대한 AmazonMWAA 액세스 액세스 제어 정책에 FullConsole 대한 액세스 권한을 사용자 AWS 계정에 부여했어야 합니다. 또한 실행 역할이 Amazon MWAA 환경에서 사용 중인 AWS 리소스에 액세스할 수 있도록 허용해야 합니다.
-
액세스 — 종속성을 웹 서버에 직접 설치하기 위해 퍼블릭 리포지토리에 액세스해야 하는 경우 퍼블릭 네트워크 웹 서버 액세스로 환경을 구성해야 합니다. 자세한 내용은 Apache Airflow 액세스 모드 단원을 참조하십시오.
-
Amazon S3 구성 — DAG,
plugins.zip
의 사용자 지정 플러그인 및requirements.txt
의 Python 종속성을 저장하는 데 사용되는 Amazon S3 버킷은 퍼블릭 액세스가 차단되고 버전 관리가 활성화된 상태로 구성되어야 합니다.
작동 방식
환경을 생성할 때 Amazon MWAA는 사용자가 Amazon MWAA 콘솔의 Airflow 구성 옵션에 지정한 구성 설정을 사용자 환경의 컨테이너에 환경 변수로 연결합니다. AWS Fargate airflow.cfg
에서 같은 이름의 설정을 사용하는 경우 Amazon MWAA 콘솔에서 지정하는 옵션이 airflow.cfg
의 값보다 우선합니다.
기본적으로 Amazon MWAA 환경의 Apache Airflow UI에는 표시되지 않지만 구성을 노출하는 설정을 포함하여 Amazon MWAA 콘솔에서 직접 Apache Airflow 구성 옵션을 변경할 수 있습니다. airflow.cfg
webserver.expose_config
구성 옵션을 사용하여 Apache Airflow v2에서 플러그인 로드
Apache Airflow v2에서는 기본적으로 core.lazy_load_plugins : True
설정을 사용하여 플러그인이 ‘느리게’ 로드되도록 구성됩니다. Apache Airflow v2에서 사용자 정의 플러그인을 사용하는 경우 각 Airflow 프로세스를 시작할 때 플러그인을 로드하여 기본 설정을 재정의하기 위해 core.lazy_load_plugins : False
을(를) Apache Airflow 구성 옵션으로 추가해야 합니다.
구성 옵션 개요
Amazon MWAA 콘솔에 구성을 추가하면 Amazon MWAA가 구성을 환경 변수로 작성합니다.
-
나열된 옵션. 드롭다운 목록에서 Apache Airflow 버전에 사용할 수 있는 구성 설정 중 하나를 선택할 수 있습니다. 예:
dag_concurrency
:16
. 구성 설정은 사용자 환경의 Fargate 컨테이너에AIRFLOW__CORE__DAG_CONCURRENCY : 16
와(과) 같이 변환됩니다. -
사용자 지정 옵션. 드롭다운 목록에서 Apache Airflow 버전에 대해 나열되지 않은 Airflow 구성 옵션을 지정할 수도 있습니다. 예:
foo.user
:YOUR_USER_NAME
. 구성 설정은 사용자 환경의 Fargate 컨테이너에AIRFLOW__FOO__USER : YOUR_USER_NAME
와(과) 같이 변환됩니다.
Apache Airflow 구성 옵션
다음 이미지는 Amazon MWAA 콘솔에서 Apache Airflow 구성 옵션을 사용자 지정할 수 있는 위치를 보여줍니다.
Apache Airflow 레퍼런스
Apache Airflow에서 지원하는 구성 옵션 목록은 Apache Airflow 참조 가이드의 구성 참조
Amazon MWAA 콘솔 사용
다음 절차에서는 Airflow 구성 옵션을 환경에 추가하는 단계를 안내합니다.
-
Amazon MWAA 콘솔에서 환경 페이지
를 엽니다. -
환경을 선택합니다.
-
편집을 선택합니다.
-
다음을 선택합니다.
-
Airflow 구성 옵션 창에서 사용자 지정 구성 추가를 선택합니다.
-
드롭다운 목록에서 구성을 선택하고 값을 입력하거나, 사용자 정의 구성을 입력하고 값을 입력합니다.
-
추가하려는 각 구성에 대해 사용자 정의 구성 추가를 선택합니다.
-
저장을 선택합니다.
구성 참조
다음 섹션에는 Amazon MWAA 콘솔의 드롭다운 목록에 있는 사용 가능한 Apache Airflow 구성 목록이 포함되어 있습니다.
이메일 구성
다음 목록은 Amazon MWAA에서 사용할 수 있는 Airflow 이메일 알림 구성 옵션을 보여줍니다.
SMTP 트래픽에는 포트 587을 사용하는 것이 좋습니다. 기본적으로 모든 Amazon EC2 인스턴스의 포트 25에서 아웃바운드 SMTP 트래픽을 AWS 차단합니다. 포트 25에서 아웃바운드 트래픽을 보내려는 경우 이 제한을 제거하도록 요청할 수 있습니다
작업 구성
다음 목록은 Amazon MWAA의 Airflow 작업에 대해 드롭다운 목록에서 사용할 수 있는 구성을 보여줍니다.
스케줄러 구성
다음 목록은 Amazon MWAA의 드롭다운 목록에서 사용할 수 있는 Apache Airflow 스케줄러 구성을 보여줍니다.
작업자 구성
다음 목록은 Amazon MWAA의 드롭다운 목록에서 사용할 수 있는 Airflow 작업자 구성을 보여줍니다.
웹 서버 구성
다음 목록은 Amazon MWAA의 드롭다운 목록에서 사용할 수 있는 Airflow 웹 서버 구성을 보여줍니다.
트리거 구성
다음 목록은 Amazon MWA에서 사용할 수 있는 Apache Airflow 트리거
예제 및 샘플 코드
DAG 예제
다음 DAG를 사용하여 email_backend
Apache Airflow 구성 옵션을 인쇄할 수 있습니다. Amazon MWAA 이벤트에 대한 응답으로 실행하려면 Amazon S3 스토리지 버킷에서 사용자 환경의 DAG 폴더에 코드를 복사합니다.
from airflow.decorators import dag from datetime import datetime def print_var(**kwargs): email_backend = kwargs['conf'].get(section='email', key='email_backend') print("email_backend") return email_backend @dag( dag_id="print_env_variable_example", schedule_interval=None, start_date=datetime(
yyyy
,m
,d
), catchup=False, ) def print_variable_dag(): email_backend_test = PythonOperator( task_id="email_backend_test", python_callable=print_var, provide_context=True ) print_variable_test = print_variable_dag()
이메일 알림 설정 예시
앱 암호를 사용하여 Gmail.com 이메일 계정에 다음과 같은 Apache Airflow 구성 옵션을 사용할 수 있습니다. 자세한 내용은 Gmail 도움말 참조 가이드의 앱 암호를 사용하여 로그인하기
다음 단계
-
DAG 추가 또는 업데이트의 Amazon S3 버킷에 DAG 폴더를 업로드하는 방법을 알아봅니다.