기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
제한 사항
AWS Glue에서 데이터 레이크 프레임워크를 사용하기 전에 다음 제한 사항을 고려하세요.
-
다음 DynamicFrame의 AWS Glue
GlueContext
방법은 데이터 레이크 프레임워크 테이블의 읽기 및 쓰기를 지원하지 않습니다. 대신 DataFrame 또는 Spark DataFrame API용GlueContext
방법을 사용하십시오.-
create_dynamic_frame.from_catalog
-
write_dynamic_frame.from_catalog
-
getDynamicFrame
-
writeDynamicFrame
-
-
Lake Formation 권한 제어에서는 다음과 같은 DataFrame
GlueContext
방법이 지원됩니다.-
create_data_frame.from_catalog
-
write_data_frame.from_catalog
-
getDataFrame
-
writeDataFrame
-
-
작은 파일 그룹화는 지원되지 않습니다.
-
작업 북마크는 지원되지 않습니다.
-
Apache Hudi 0.10.1 for AWS Glue 3.0은 Hudi 읽을 때 병합(MoR) 테이블을 지원하지 않습니다.
-
ALTER TABLE … RENAME TO
는 Apache Iceberg 0.13.1 for AWS Glue 3.0에서 사용할 수 없습니다.
Lake Formation 권한으로 관리되는 데이터 레이크 형식 테이블에 대한 제한
데이터 레이크 형식은 Lake Formation 권한을 통해 AWS Glue ETL과 통합됩니다. create_dynamic_frame
를 사용하여 DynamicFrame을 생성하는 것은 지원되지 않습니다. 자세한 내용은 다음 예를 참조하세요.
참고
Apache Hudi, Apache Iceberg, Delta Lake에 대한 Lake Formation 권한을 통한 AWS Glue ETL과의 통합은 AWS Glue 버전 4.0에서만 지원됩니다.
Apache Iceberg는 Lake Formation 권한을 통해 AWS Glue ETL과 가장 잘 통합됩니다. 거의 모든 작업을 지원하며 SQL 지원을 포함합니다.
Hudi는 관리 작업을 제외한 대부분의 기본 작업을 지원합니다. 이러한 옵션은 일반적으로 데이터 프레임 작성을 통해 수행되고 additional_options
를 통해 지정되기 때문입니다. SparkSQL은 지원되지 않으므로 AWS Glue API를 사용하여 작업을 위한 DataFrames을 생성해야 합니다.
Delta Lake는 테이블 데이터의 읽기, 추가, 덮어쓰기만 지원합니다. Delta Lake에서는 업데이트와 같은 다양한 작업을 수행하려면 자체 라이브러리를 사용해야 합니다.
Lake Formation 권한으로 관리되는 Iceberg 테이블에는 다음 기능을 사용할 수 없습니다.
AWS Glue ETL을 사용한 압축
AWS Glue ETL을 통한 Spark SQL 지원
Lake Formation 권한으로 관리되는 Hudi 테이블의 제한 사항은 다음과 같습니다.
분리된 파일 제거
Lake Formation 권한으로 관리되는 Delta Lake 테이블의 제한 사항은 다음과 같습니다.
Delta Lake 테이블에서 삽입 및 읽기 이외의 모든 기능.