本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
后续步骤
了解 AWS Glue 转换
为了提高数据处理的效率, AWS Glue 包括内置的转换函数。这些函数在名为 a 的数据结构中从一个变换传递到另一个变换 DynamicFrame,该数据结构是 Apache Spark
要熟悉几个 AWS Glue PySpark 内置函数,请参阅博客文章 “在不使用 AWS 账户的情况下在本地构建 AWS Glue ETL 管道
编写您的第一个 ETL 作业
如果你以前没有写过 ETL 作业,你可以先使用三种 AWS Glue ETL 作业类型将数据转换为 Apache Par quet 模式。
如果您有编写 ETL 作业的经验,则可以使用这些AWS Glue
GitHub 示例
定价
有关定价信息,请参阅 AWS Glue
定价