本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
AWS Glue 版本
你可以配置 AWS Glue 添加或更新作业时的版本参数。这些区域有:AWS Glue 版本决定了 Apache Spark 和 Python 的版本 AWS Glue 支持。Python 版本指示了 Spark 类型的任务支持的版本。下表列出了可用的 AWS Glue 版本、相应的 Spark 和 Python 版本以及其他功能更改。
AWS Glue 版本
AWS Glue 版本 | 支持的运行时环境版本 | 支持的 Java 版本 | 功能更改 |
---|---|---|---|
AWS Glue 4.0 | Spark 环境版本
|
Java 8 |
AWS Glue 4.0 是最新版本的 AWS Glue。 其中内置了多项优化和升级 AWS Glue 发布,例如:
限制以下是限制 AWS Glue 4.0:
有关迁移到的更多信息 AWS Glue 版本 4.0,请参阅将 AWS Glue for Spark 作业迁移到 AWS Glue 版本 4.0。 |
Ray 环境版本
|
不适用 |
使用 AWS Glue for Ray 构建和运行分布式 Python 应用程序。
AWS Glue 4.0 中对 Ray 作业的限制
|
|
AWS Glue 3.0 |
|
Java 8 |
除了将 Spark 引擎升级到 3.0 之外,还内置了优化和升级 AWS Glue 发布,例如:
限制以下是限制 AWS Glue 3.0:
有关迁移到的更多信息 AWS Glue 版本 3.0,请参阅将 AWS Glue for Spark 作业迁移到 AWS Glue 版本 3.0。 |
AWS Glue 2.0(已弃用,支持终止) |
|
不适用 |
除了中提供的功能外 AWS Glue 版本 1.0,AWS Glue 版本 2.0 还提供:
注意AWS Glue 版本 2.0 不同于 AWS Glue 1.0 版本适用于某些依赖项和由于底层架构变更而导致的版本。验证你的 AWS Glue 跨专业迁移之前的工作 AWS Glue 版本发布。 有关 AWS Glue 2.0 版的功能和限制,请参阅运行 Spark ETL 作业,缩短启动时间。 |
AWS Glue 1.0(已弃用,支持终止) |
|
不适用 |
你可以维护 Parquet 的工作书签和ORC格式 AWS Glue ETL工作(使用 AWS Glue 版本 1.0)。以前,您只能为常见的 Amazon S3 源格式添加书签JSON,例如、CSV、Apache Avro 和 XML AWS Glue ETL工作。 为ETL输入和输出设置格式选项时,可以指定使用 Apache Avro 读取器/写入器格式 1.8 来支持 Avro 逻辑类型读写(使用 AWS Glue 版本 1.0)。以前,只支持版本 1.7 Avro 读取器/写入器格式。 DynamoDB 连接类型支持写入器选项(使用 AWS Glue 版本 1.0)。 限制以下是限制 AWS Glue 1.0:
|
AWS Glue 0.9(已弃用,支持终止) |
|
不适用 |
未指定任务而创建的作业 AWS Glue 版本默认为 AWS Glue 0.9。 限制以下是限制 AWS Glue 0.9:
|
注意
以下 Glue 版本支持以下版本 PythonShell:
PythonShell Glue 1.0 版本支持 v3.6。
PythonShell Glue 3.0 版本支持 v3.9。
此外,仅在 Glue 版本 1.0 和 0.9 中支持开发端点。