기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
Amazon Managed Workflows for Apache Airflow란 무엇입니까?
Apache Airflow의 관리형 오케스트레이션 서비스인 Amazon Managed Workflows for Apache Airflow
Amazon 에서는 확장성MWAA, 가용성 및 보안을 위해 기본 인프라를 관리할 필요 없이 Apache Airflow 및 Python을 사용하여 워크플로를 생성할 수 있습니다. Amazon은 필요에 맞게 워크플로 실행 용량을 MWAA 자동으로 확장하고 AWS 보안 서비스와 통합하여 데이터에 대한 빠르고 안전한 액세스를 제공합니다.
기능
다음 기능을 검토하여 Amazon이 Apache Airflow 워크플로 관리를 간소화MWAA하는 방법을 알아봅니다.
-
자동 Airflow 설정 - Amazon MWAA 환경을 생성할 때 Apache Airflow 버전을 선택하여 Apache Airflow를 빠르게 설정합니다. AmazonMWAA은 인터넷에서 다운로드할 수 있는 것과 동일한 Apache Airflow 사용자 인터페이스와 오픈 소스 코드를 사용하여 Apache Airflow를 설정합니다.
-
자동 규모 조정 – 사용자 환경에서 실행되는 최소 및 최대 작업자 수를 설정하여 Apache Airflow 작업자를 규모를 자동으로 조정합니다. Amazon은 환경의 작업자를 MWAA 모니터링하고 Auto Scaling 구성 요소를 사용하여 사용자가 정의한 최대 작업자 수에 도달할 때까지 수요를 충족할 작업자를 추가합니다.
-
기본 제공 인증 - AWS Identity and Access Management ()에서 액세스 제어 정책을 정의하여 Apache Airflow 웹 서버에 대한 역할 기반 인증 및 권한을 활성화합니다IAM. Apache Airflow 작업자는 AWS 서비스에 대한 보안 액세스를 위해 이러한 정책을 수임합니다.
-
기본 제공 보안 - Apache Airflow 작업자 및 스케줄러는 Amazon MWAA의 Amazon에서 실행됩니다VPC. 또한 데이터는를 사용하여 자동으로 암호화 AWS Key Management Service되므로 환경은 기본적으로 안전합니다.
-
퍼블릭 또는 프라이빗 액세스 모드 – 프라이빗 또는 퍼블릭 액세스 모드를 사용하여 Apache Airflow 웹 서버에 액세스합니다. 퍼블릭 네트워크 액세스 모드는 인터넷을 통해 액세스할 수 있는 Apache Airflow 웹 서버의 VPC 엔드포인트를 사용합니다. 프라이빗 네트워크 액세스 모드는 에서 VPC액세스할 수 있는 Apache Airflow 웹 서버의 VPC 엔드포인트를 사용합니다. 두 경우 모두 Apache Airflow 사용자에 대한 액세스는 AWS Identity and Access Management (IAM) 및에서 정의한 액세스 제어 정책에 의해 제어됩니다 AWS SSO.
-
간소화된 업그레이드 및 패치 - Amazon은 정기적으로 새로운 버전의 Apache Airflow를 MWAA 제공합니다. Amazon MWAA 팀은 이러한 버전의 이미지를 업데이트하고 패치합니다.
-
워크플로 모니터링 - Amazon에서 Apache Airflow 로그 및 Apache Airflow 지표 CloudWatch 를 보고 추가 타사 도구 없이 Apache Airflow 작업 지연 또는 워크플로 오류를 식별합니다. Amazon은 환경 지표를 MWAA 자동으로 전송하고 활성화된 경우 Apache Airflow 로그를에 전송합니다 CloudWatch.
-
AWS 통합 - Amazon은 Amazon Athena, AWS Batch, Amazon, CloudWatchAmazon DynamoDB, Amazon AWS DataSync EMR, Amazon , Amazon AWS Fargate EKS, Amazon Data Firehose, AWS Glue AWS Lambda, Amazon Redshift, Amazon , Amazon SQS, SNSAmazon SageMaker AI 및 Amazon S3뿐만 아니라 수백 개의 내장 및 커뮤니티 생성 운영자 및 센서와의 오픈 소스 통합을 MWAA 지원합니다.
-
작업자 플릿 - AmazonMWAA은 컨테이너를 사용하여 작업자 플릿을 온디맨드로 확장하고 Amazon ECS on AWS Fargate을 사용하여 스케줄러 중단을 줄일 수 있도록 지원합니다. Amazon ECS 컨테이너에서 작업을 호출하는 연산자와 Kubernetes 클러스터에서 포드를 생성하고 실행하는 Kubernetes 연산자가 지원됩니다.
아키텍처
외부 상자(아래 이미지)에 포함된 모든 구성 요소는 계정의 단일 Amazon MWAA 환경으로 표시됩니다. Apache Airflow 스케줄러 및 작업자는 VPC 환경의 Amazon에서 프라이빗 서브넷에 연결하는 AWS Fargate 컨테이너입니다. 각 환경에는 프라이빗 보안 VPC 엔드포인트를 통해 스케줄러 및 작업자 Fargate 컨테이너에 액세스할 수 AWS 있는에서 관리하는 자체 Apache Airflow 메타데이터베이스가 있습니다.
Amazon CloudWatch, Amazon S3, Amazon SQS및 AWS KMS 는 AmazonMWAA과 별개이며 Fargate 컨테이너의 Apache Airflow 스케줄러(들) 및 작업자로부터 액세스할 수 있어야 합니다.
Apache Airflow 웹 서버는 퍼블릭 네트워크 Apache Airflow 액세스 모드를 선택하거나 에서 프라이빗 네트워크 Apache Airflow 액세스 모드를 선택하여 VPC 인터넷을 통해 액세스할 수 있습니다. 두 경우 모두 Apache Airflow 사용자의 액세스는 AWS Identity and Access Management ()에서 정의한 액세스 제어 정책에 의해 제어됩니다IAM.
참고
다중 Apache Airflow 스케줄러는 Apache Airflow v2 이상에서만 사용할 수 있습니다. Apache Airflow 참조 가이드의 개념
![이 이미지는 Amazon MWAA 환경의 아키텍처를 보여줍니다.](images/mwaa-architecture.png)
통합
Apache Airflow 오픈 소스 커뮤니티는 Apache Airflow가 AWS 서비스와 통합할 수 있도록 운영자(서비스에 대한 연결을 간소화하는 플러그인)를 제공합니다. 여기에는 Amazon S3, Amazon Redshift, Amazon EMR AWS Batch, Amazon SageMaker AI와 같은 서비스와 다른 클라우드 플랫폼의 서비스가 포함됩니다.
Amazon에서 Apache Airflow를 사용하면 Apache Hadoop, Presto, Hive, Spark와 같은 인기 있는 타사 도구 및 AWS 서비스와의 통합을 MWAA 완벽하게 지원하여 데이터 처리 작업을 수행할 수 있습니다. AmazonMWAA은 Apache Airflow 와의 호환성을 유지하기 위해 최선을 다하고 있으며API, AmazonMWAA은 AWS 서비스에 안정적인 통합을 제공하고 이를 커뮤니티에 제공하고 커뮤니티 기능 개발에 참여하고자 합니다.
샘플 코드에 대한 내용은 Amazon Managed Workflows for Apache Airflow용 코드 예제 섹션을 참조하십시오.
지원되는 버전
Amazon은 여러 버전의 Apache Airflow를 MWAA 지원합니다. 지원하는 Apache Airflow 버전과 각 버전에 포함된 Apache Airflow 구성 요소에 대한 자세한 내용은 Amazon Managed Workflows for Apache Airflow의 Apache Airflow 버전 단원을 참조하십시오.
다음 단계
-
에서 Airflow DAGs 및 지원 파일, 퍼블릭 라우팅이 VPC 있는 Amazon 및 Amazon 환경을 위한 Amazon S3 버킷을 생성하는 단일 AWS CloudFormation 템플릿으로 시작합니다Amazon Managed Workflows for Apache Airflow용 빠른 시작 튜토리얼. MWAA
-
Airflow DAGs 및 지원 파일에 대한 Amazon S3 버킷을 생성하고, 세 가지 Amazon VPC 네트워킹 옵션 중 하나를 선택하고,에서 Amazon MWAA 환경을 생성하여 점진적으로 시작합니다Amazon Managed Workflows for Apache Airflow 시작하기.