本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 AWS Glue 爬网程序创建数据目录
AWS Glue 爬网程序在运行时会创建一个数据目录和架构,它们映射到会话和应用程序报告的结构。每次在 Amazon S3 存储桶中存储新报告时,都必须运行爬网程序以使用新报告中的数据更新 AWS Glue 数据目录。
注意
费用可能适用于运行您的 AWS Glue 爬网程序。有关更多信息,请参阅AWS Glue 定价
通过 https://console.aws.amazon.com/glue/
打开 AWS Glue 控制台。 选择您已订阅使用情况报告的 AWS 区域。
选择名为 appstream-usage-sessions-crawler 的爬网程序旁边的复选框,然后选择 Run crawler (运行爬网程序)。对于名为 appstream-usage-apps-crawler 的爬网程序重复此步骤。
执行这些步骤将运行爬网程序并将安排它们自动根据在 AWS CloudFormation 堆栈中指定的计划运行。
在这两个爬网程序都完成运行后,在导航窗格中,选择 Databases (数据库)。将显示名为 appstream-usage 的数据库,这表示您的使用率报告。此数据库是 AWS Glue 数据目录,它是在运行 appstream-usage-sessions-crawler 和 appstream-usage-apps-crawler 时创建的。
要查看数据库中的表,请选择 appstream-usage 和 Tables (表)。将显示两个表:applications (应用程序) 和 sessions (会话),它们分别表示您的应用程序和会话使用率报告。选择任一表以查看其架构。
您现在可以在 Athena 中使用 SQL 查询这些表。