与 AWS Glue 集成 - Amazon Athena

与 AWS Glue 集成

AWS Glue 是一项完全托管式 ETL(提取、转换和加载)AWS 服务。其关键能力之一是对数据进行分析和分类。您可以使用 AWS Glue 爬网程序自动从 Amazon S3 中的数据推断数据库和表架构,并将关联的元数据存储在 AWS Glue Data Catalog。

Athena 使用 AWS Glue Data Catalog 在您的亚马逊云科技账户中存储和检索 Amazon S3 数据的表元数据。通过表元数据,Athena 查询引擎可以了解如何查找、读取和处理您要查询的数据。

要在 AWS Glue Data Catalog 中创建数据库和表架构,您可以在 Athena 中对数据源运行 AWS Glue 爬网程序,或者您可以直接在 Athena 查询编辑器中运行数据定义语言 (DDL) 查询。然后,使用您创建的数据库和表架构,您可以使用 Athena 中的数据操作 (DML) 查询来查询数据。

您可以从不属于您自己的账户中注册 AWS Glue Data Catalog。在您为 AWS Glue 配置所需的 IAM 权限之后,就可以使用 Athena 运行跨账户查询。有关更多信息,请参阅 授予 AWS Glue 数据目录跨账户访问权限

有关 AWS Glue Data Catalog 的更多信息,请参阅《AWS Glue 开发人员指南》中的 AWS Glue 中的数据目录和爬网程序

需单独支付 AWS Glue 的费用。有关更多信息,请参阅AWS Glue 定价