本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
亚马逊正在EMR发布 EKS 7.2.0 版本
本页介绍亚马逊在EKS部署时专为亚马逊EMR提供的新功能和更新功能。EMR有关亚马逊在亚马逊上EMR运行EC2以及亚马逊 EMR 7.2.0 版本的总体详情,请参阅《亚马逊发行指南》中的 A ma EMR zon EMR 7.2.0。
亚马逊正在EMR发布 EKS 7.2 版本
以下亚马逊 EMR 7.2.0 版本可在亚马逊EMR上EKS使用。选择特定的 emr-7.2.0 XXXX 版本以查看更多详细信息,例如相关的容器镜像标签。
发行说明
亚马逊 EMR EKS 7.2.0 版本发布说明
-
支持的应用程序 AWS SDK for Java 2.23.18 and 1.12.705, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.14.1-amzn-0, Apache Iceberg 1.5.0-amzn-0, Delta 3.1.0, Apache Spark RAPIDS 24.02.0-amzn-1, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-0, Flink Operator 1.8.0-amzn-1
-
支持的组件 -
aws-sagemaker-spark-sdk
、emr-ddb
、emr-goodies
、emr-s3-select
、emrfs
、hadoop-client
、hudi
、hudi-spark
、iceberg
、spark-kubernetes
。 -
支持的配置分类
与StartJobRun和一起使用 CreateManagedEndpointAPIs:
分类 描述 core-site
更改
core-site.xml
Hadoop 文件中的值。emrfs-site
更改EMRFS设置。
spark-metrics
更改
metrics.properties
Spark 文件中的值。spark-defaults
更改
spark-defaults.conf
Spark 文件中的值。spark-env
更改 Spark 环境中的值。
spark-hive-site
更改
hive-site.xml
Spark 文件中的值。spark-log4j2
更改
log4j2.properties
Spark 文件中的值。emr-job-submitter
任务提交者 Pod 的配置。
专门用于以下用途 CreateManagedEndpointAPIs:
分类 描述 jeg-config
更改 Jupyter Enterprise Gateway
jupyter_enterprise_gateway_config.py
文件中的值。jupyter-kernel-overrides
更改 Jupyter 内核规范文件中内核映像的值。
配置分类允许您自定义应用程序。它们通常对应于应用程序的配置XML文件,例如
spark-hive-site.xml
。有关更多信息,请参阅配置应用程序。
显著功能
Amazon 7.2.0 版本中包含以下功能EMR。EKS
-
应用程序升级 — 亚马逊EMR在 EKS 7.2.0 上的应用程序升级包括 Spark 3.5.1、Flink 1.18.1 和 Flink Operator 1.8.0。
-
适用于 Flink 的 Autoscaler 更新:7.2.0 发行版使用开源配置
job.autoscaler.restart.time-tracking.enabled
来启用重新缩放时间估计,因此无需再为重启时间手动分配经验值。如果您运行的是 7.1.0 或更低版本,您仍然可以使用 Amazon EMR 自动扩展。 -
EMR亚马逊EKS上的 Apache Hudi 集成 Apache Flink — 此版本增加了 Apache Hudi 和 Apache Flink 之间的集成,因此你可以使用 Flink Kubernetes 运算符来运行 Hudi 作业。Hudi 允许您使用记录级操作,从而简化数据管理和数据管道开发。
-
Amazon S3 Express One Zone 与亚马逊集成 EKS — EMR 在 7.2.0 及更高版本中,你可以在亚马逊开启的情况下将数据上传到 S3 Express One Z EMR on EKS e。S3 Express One Zone 是一种高性能的单区 Amazon S3 存储类,可为大多数延迟敏感型应用程序提供一致的个位数毫秒级数据访问。S3 Express One Zone 在其发布时,提供了 Amazon S3 中延迟最低、性能最高的云对象存储。
-
支持 Spark 运算符中的默认配置 — 亚马逊上的 Spark 运算符EKS现在支持的默认配置与亚马逊 EMR 7.2.0 及更高版本EKS的启动任务运行模式相同。这意味着诸如 Amazon S3 之类的功能EMRFS不再需要在 yaml 文件中进行手动配置。