EMR Serverless용 자습서
이 섹션에서는 EMR Serverless 애플리케이션에서 작업할 때 일반적인 사용 사례를 설명합니다. 여기에는 Spark 작업을 제출하기 위해 Python 및 Python 라이브러리를 사용하고 대규모 데이터세트에 대한 작업을 수행하기 위해 Hudi 및 Iceberg를 비롯한 다양한 도구가 포함되어 있습니다.
주제
- Amazon EMR Serverless에서 Java 17 사용
- EMR Serverless에서 Apache Hudi 사용
- EMR Serverless에서 Apache Iceberg 사용
- EMR Serverless에서 Python 라이브러리 사용
- EMR Serverless에서 다양한 Python 버전 사용
- EMR Serverless와 함께 델타 레이크 OSS 사용
- Airflow에서 EMR Serverless 작업 제출
- EMR Serverless에서 Hive 사용자 정의 함수 사용
- EMR Serverless에서 사용자 지정 이미지 사용
- Amazon EMR Serverless에서 Apache Spark용 Amazon Redshift 통합 사용
- Amazon EMR Serverless를 사용하여 DynamoDB에 연결