최신 버전 AWS Glue 사용 -

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

최신 버전 AWS Glue 사용

최신 버전을 AWS Glue 사용하는 것이 좋습니다. 각 버전에는 작업 성능을 자동으로 개선할 수 있는 몇 가지 최적화 및 업그레이드가 내장되어 있습니다. 예를 들어 AWS Glue 4.0은 다음과 같은 새로운 기능을 제공합니다.

  • 새롭게 최적화된 Apache Spark 3.3.0 런타임 — AWS Glue 4.0은 Apache Spark 3.3.0 런타임을 기반으로 빌드되어 오픈 소스 Spark와 비슷한 수준의 성능 향상을 제공합니다. Spark 3.3.0 런타임은 Spark 2.x의 다양한 혁신 기능을 기반으로 합니다.

  • 향상된 Amazon Redshift 커넥터 — AWS Glue 4.0 이상 버전은 아파치 스파크를 위한 Amazon Redshift 통합을 제공합니다. 통합은 기존 오픈 소스 커넥터를 기반으로 하며 성능 및 보안을 위해 커넥터를 강화합니다. 통합을 통해 애플리케이션이 최대 10배 더 빠르게 작동할 수 있습니다. 자세한 내용은 Amazon Redshift와 Apache Spark의 통합에 대한 블로그 게시물을 참조하십시오.

  • SIMDCSV및 JSON 데이터를 포함한 벡터화된 읽기에 대한 기반 실행 — AWS Glue 버전 3.0 이상 버전에는 행 기반 판독기에 비해 전반적인 작업 성능을 크게 향상시킬 수 있는 최적화된 판독기가 추가되었습니다. CSV데이터에 대한 자세한 내용은 벡터화된 판독기를 사용한 읽기 성능 최적화를 참조하십시오. SIMD CSV JSON데이터에 대한 자세한 내용은 Apache Arrow 열 형식 형식의 벡터화된 SIMD JSON 판독기 사용을 참조하십시오.

각 AWS Glue 버전에는 커넥터, 드라이버 및 라이브러리 업데이트를 비롯한 많은 업그레이드 중에서 이러한 종류의 업그레이드가 포함됩니다. 자세한 내용은 AWS Glue 버전 및 AWS Glue 버전 4.0으로의 AWS Glue 작업 마이그레이션을 참조하십시오.