使用 AWS Glue 爬网程序创建数据目录 - 亚马逊 AppStream 2.0

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 AWS Glue 爬网程序创建数据目录

AWS Glue 爬网程序在运行时会创建一个数据目录和架构,它们映射到会话和应用程序报告的结构。每次在 Amazon S3 存储桶中存储新报告时,都必须运行爬网程序以使用新报告中的数据更新 AWS Glue 数据目录。

注意

费用可能适用于运行您的 AWS Glue 爬网程序。有关更多信息,请参阅AWS Glue 定价

  1. 通过 https://console.aws.amazon.com/glue/ 打开 AWS Glue 控制台。

  2. 选择您已订阅使用情况报告的 AWS 区域。

  3. 选择名为 appstream-usage-sessions-crawler 的爬网程序旁边的复选框,然后选择 Run crawler (运行爬网程序)。对于名为 appstream-usage-apps-crawler 的爬网程序重复此步骤。

    执行这些步骤将运行爬网程序并将安排它们自动根据在 AWS CloudFormation 堆栈中指定的计划运行。

  4. 在这两个爬网程序都完成运行后,在导航窗格中,选择 Databases (数据库)。将显示名为 appstream-usage 的数据库,这表示您的使用率报告。此数据库是 AWS Glue 数据目录,它是在运行 appstream-usage-sessions-crawlerappstream-usage-apps-crawler 时创建的。

  5. 要查看数据库中的表,请选择 appstream-usageTables (表)。将显示两个表:applications (应用程序)sessions (会话),它们分别表示您的应用程序和会话使用率报告。选择任一表以查看其架构。

    您现在可以在 Athena 中使用 SQL 查询这些表。