서버리스 ETL 켜기 시작하기 AWS Glue - AWS 규범적 지침

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

서버리스 ETL 켜기 시작하기 AWS Glue

디어 토프라니와 아드난 알비, Amazon Web Services(AWS)

2024년 3월 (문서 기록)

Amazon Web Services(AWS) 클라우드의 AWS Glue은(는) 데이터를 대규모로 추출, 전환, 적재(ETL) 할 수 있는 완전한 관리형 서버리스 환경입니다. 를 사용하면 비용 효율적인 방식으로 데이터를 분류하고, 정리하고, 보강하고, 다양한 데이터 저장소 및 스트림에서 안정적으로 이동할 수 있습니다. AWS Glue

AWS Glue 서버리스이므로 서버 프로비저닝이나 관리에 대해 걱정할 필요가 없습니다. 를 사용하면 사용한 AWS Glue리소스에 대해서만 비용을 지불하고 필요에 따라 규모를 늘리거나 줄일 수 있습니다.

AWS Glue 다음과 같은 구성 요소로 구성됩니다.

  • AWS Glue ETL — AWS Glue ETL은 한 소스에서 다른 소스로 데이터를 추출, 변환 및 로드하기 위한 배치 및 스트리밍 옵션을 제공합니다.

  • AWS Glue Data Catalog – Data Catalog는 모든 데이터 자산의 메타데이터를 구성하는 중앙 리포지토리입니다. Data Catalog는 데이터 분석 서비스 전반에서 데이터 자산을 검색, 발견 및 공유할 수 있는 통합 인터페이스를 제공합니다.

  • AWS Glue DataBrew— DataBrew 코드를 사용하지 않는 데이터 준비 도구로, 데이터를 시각적으로 탐색하고, 정리하고, 변환하는 데 사용할 수 있습니다. 사전 빌드된 250개 이상의 변환 중에서 선택하여 코드를 작성하지 않고도 데이터 준비 작업을 자동화할 수 있습니다.

이 안내서는 작동 방식 및 사용을 시작하는 방법을 AWS Glue포함하여 고급 수준의 소개를 제공합니다. 자동화, 모니터링, 다른 서비스와의 통합 등 AWS Glue 작업을 작성하기 전에 알아야 할 주요 개념을 다룹니다. AWS 다음 단계 섹션은 AWS Glue에 코드를 작성하는 방법을 빠르게 설명합니다. 이미 사용해 AWS Glue본 경험이 있는 경우 모범 사례 섹션을 통해 지식의 격차를 해소할 수 있습니다. 이 안내서를 마치면 AWS Glue 의 사용을 효과적으로 시작하는 데 필요한 지식과 리소스를 갖추게 될 것입니다.