쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

Amazon Managed Workflows for Apache Airflow란 무엇입니까?

포커스 모드
Amazon Managed Workflows for Apache Airflow란 무엇입니까? - Amazon Managed Workflows for Apache Airflow

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Apache Airflow의 관리형 오케스트레이션 서비스인 Amazon Managed Workflows for Apache Airflow를 사용하여 클라우드에서 대규모로 데이터 파이프라인을 설정하고 운영할 수 있습니다. Apache Airflow는 워크플로우라고 하는 프로세스 및 작업 시퀀스를 프로그래밍 방식으로 작성, 예약 및 모니터링하는 데 사용되는 오픈 소스 도구입니다.

Amazon MWAA를 사용하면 확장성, 가용성 및 보안을 위해 기본 인프라를 관리할 필요 없이 Apache Airflow와 Python을 사용하여 워크플로우를 생성할 수 있습니다. Amazon MWAA는 필요에 맞게 워크플로 실행 용량을 자동으로 확장하고 AWS 보안 서비스와 통합하여 데이터에 대한 빠르고 안전한 액세스를 제공합니다.

기능

다음 기능을 검토하여 Amazon MWAA가 Apache Airflow 워크플로 관리를 간소화하는 방법을 알아봅니다.

  • Automatic Airflow 설정 – Amazon MWAA 환경을 생성할 때 Apache Airflow 버전을 선택하여 Apache Airflow를 빠르게 설정할 수 있습니다. Amazon MWAA는 인터넷에서 다운로드할 수 있는 것과 동일한 Apache Airflow 사용자 인터페이스와 오픈 소스 코드를 사용하여 자동으로 Apache Airflow를 설정합니다.

  • 자동 규모 조정 – 사용자 환경에서 실행되는 최소 및 최대 작업자 수를 설정하여 Apache Airflow 작업자를 규모를 자동으로 조정합니다. Amazon MWAA는 사용자 환경의 작업자를 모니터링하고 자동 규모 조정 구성 요소를 사용하여 사용자가 정의한 최대 작업자 수에 도달할 때까지 수요에 맞춰 작업자를 추가합니다.

  • 기본 제공 인증 - AWS Identity and Access Management (IAM)에서 액세스 제어 정책을 정의하여 Apache Airflow 웹 서버에 대한 역할 기반 인증 및 권한 부여를 활성화합니다. Apache Airflow 작업자는 AWS 서비스에 대한 보안 액세스를 위해 이러한 정책을 가정합니다.

  • 내장 보안 – Apache Airflow 작업자스케줄러Amazon MWAA의 Amazon VPC에서 실행됩니다. 또한 데이터는를 사용하여 자동으로 암호화 AWS Key Management Service되므로 환경은 기본적으로 안전합니다.

  • 퍼블릭 또는 프라이빗 액세스 모드 – 프라이빗 또는 퍼블릭 액세스 모드를 사용하여 Apache Airflow 웹 서버에 액세스합니다. 퍼블릭 네트워크 액세스 모드는 인터넷을 통해 액세스할 수 있는 Apache Airflow 웹 서버의 VPC 엔드포인트를 사용합니다. 프라이빗 네트워크 액세스 모드는 사용자의 VPC에서 액세스할 수 있는 Apache Airflow 웹 서버의 VPC 엔드포인트를 사용합니다. 두 경우 모두 Apache Airflow 사용자의 액세스는 AWS Identity and Access Management (IAM) 및 AWS SSO에서 정의한 액세스 제어 정책에 의해 제어됩니다.

  • 간소화된 업그레이드 및 패치 – Amazon MWAA는 정기적으로 새 버전의 Apache Airflow를 제공합니다. Amazon MWAA 팀이 해당 버전의 이미지를 업데이트하고 패치합니다.

  • 워크플로우 모니터링 – Amazon CloudWatch에서 Apache Airflow 로그 및 Apache Airflow 지표를 확인하여 추가 타사 도구 없이도 Apache Airflow 작업 지연 또는 워크플로우 오류를 식별할 수 있습니다. Amazon MWAA는 환경 지표를 자동으로 전송하며, 활성화된 경우 Apache Airflow 로그를 CloudWatch에 전송합니다.

  • AWS 통합 - Amazon MWAA는 Amazon Athena, AWS Batch, Amazon CloudWatch, Amazon DynamoDB, AWS DataSync, Amazon EMR, AWS Fargate, Amazon EKS, Amazon Data Firehose, AWS Glue, AWS Lambda,, Amazon Redshift, Amazon SQS, Amazon SNS, Amazon SageMaker AI, Amazon S3, 수백 개의 내장 및 커뮤니티 생성 운영자 및 센서와의 오픈 소스 통합을 지원합니다.

  • 작업자 플릿 — Amazon MWAA는 컨테이너를 사용하여 온디맨드로 작업자 플릿의 규모를 조정하고 AWS Fargate의 Amazon ECS를 사용하여 스케줄러 중단을 줄일 수 있도록 지원합니다. Amazon ECS 컨테이너에서 작업을 호출하는 연산자와 Kubernetes 클러스터에서 파드를 생성하고 실행하는 Kubernetes 연산자가 지원됩니다.

아키텍처

외부 상자(아래 이미지)에 포함된 모든 구성 요소는 계정에서 단일 Amazon MWAA 환경으로 나타납니다. Apache Airflow 스케줄러작업자는 환경의 Amazon VPC에 있는 프라이빗 서브넷에 연결하는 AWS Fargate 컨테이너입니다. 각 환경에는 프라이빗 보안 VPC 엔드포인트를 통해 스케줄러작업자 Fargate 컨테이너에 액세스할 수 AWS 있는에서 관리하는 자체 Apache Airflow 메타데이터베이스가 있습니다.

Amazon CloudWatch, Amazon S3, Amazon SQS 및 AWS KMS 는 Amazon MWAA와 별개이며 Fargate 컨테이너의 Apache Airflow 스케줄러(들)작업자로부터 액세스할 수 있어야 합니다.

퍼블릭 네트워크 Apache Airflow 액세스 모드를 선택하여 인터넷을 통해 Apache Airflow 웹 서버에 액세스하거나 사용자의 VPC 내에서 프라이빗 네트워크 Apache Airflow 액세스 모드를 선택하여 액세스할 수 있습니다. 두 경우 모두 Apache Airflow 사용자에 대한 액세스는 AWS Identity and Access Management (IAM)에서 정의한 액세스 제어 정책에 의해 제어됩니다.

참고

다중 Apache Airflow 스케줄러는 Apache Airflow v2 이상에서만 사용할 수 있습니다. Apache Airflow 참조 가이드개념에서 Apache Airflow 작업 수명 주기에 대해 자세히 알아봅니다.

이 이미지는 Amazon MWAA 환경의 아키텍처를 보여줍니다.

통합

Apache Airflow 오픈 소스 커뮤니티는 Apache Airflow가 AWS 서비스와 통합할 수 있도록 활성 및 성장 중인 Apache Airflow 오픈 소스 커뮤니티에 운영자(서비스에 대한 연결을 간소화하는 플러그인)를 제공합니다. 여기에는 Amazon S3, Amazon Redshift, Amazon EMR AWS Batch, Amazon SageMaker AI와 같은 서비스와 다른 클라우드 플랫폼의 서비스가 포함됩니다.

Amazon MWAA에서 Apache Airflow를 사용하면 Apache Hadoop, Presto, Hive, Spark와 같은 인기 있는 타사 도구 및 AWS 서비스와의 통합을 완벽하게 지원하여 데이터 처리 작업을 수행할 수 있습니다. Amazon MWAA는 Apache Airflow API와의 호환성을 유지하기 위해 최선을 다하고 있으며, Amazon MWAA는 AWS 서비스에 대한 안정적인 통합을 제공하고 커뮤니티에서 사용할 수 있도록 하고 커뮤니티 기능 개발에 참여하려고 합니다.

샘플 코드에 대한 내용은 Amazon Managed Workflows for Apache Airflow용 코드 예제 섹션을 참조하십시오.

지원되는 버전

Amazon MWAA는 여러 버전의 Apache Airflow를 지원합니다. 지원하는 Apache Airflow 버전과 각 버전에 포함된 Apache Airflow 구성 요소에 대한 자세한 내용은 Amazon Managed Workflows for Apache Airflow의 Apache Airflow 버전 단원을 참조하십시오.

다음 단계

이 페이지에서

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.