Creación de un catálogo de datos mediante el rastreador de AWS Glue
El rastreador de AWS Glue, cuando se ejecuta, crea un esquema y un catálogo de datos que se asignan a la estructura de sus informes de sesiones y aplicaciones. Cada vez que se almacena un nuevo informe en su bucket de Amazon S3, debe ejecutar el rastreador para actualizar su catálogo de datos de AWS Glue con los datos del nuevo informe.
nota
Se pueden aplicar cargos por la ejecución del rastreador de AWS Glue. Para más información, consulte Precios de AWS Glue
Abra la consola de AWS Glue en https://console.aws.amazon.com/glue/
. Elija la región de AWS para la que se ha suscrito a informes de uso.
Seleccione la casilla de verificación situada junto al rastreador denominado appstream-usage-sessions-crawler y, a continuación, elija Run crawler (Ejecutar rastreador). Repita este paso para el rastreador llamado appstream-usage-apps-crawler.
Con estos pasos se ejecutan los rastreadores y se programan para que se ejecuten automáticamente de acuerdo con la programación especificada en la pila de AWS CloudFormation.
Cuando ambos rastreadores terminen de ejecutarse, en el panel de navegación, elija Databases (Bases de datos). Se muestra una base de datos denominada appstream-usage, que representa sus informes de uso. Esta base de datos es un catálogo de datos de AWS Glue que se creó cuando se ejecutaron appstream-usage-sessions-crawler y appstream-usage-apps-crawler.
Para ver las tablas de la base de datos, elija appstream-usage, Tables (Tablas). Se muestran dos tablas, applications (aplicaciones) y sessions (sesiones), que representan los informes de uso de aplicaciones y sesiones, respectivamente. Elija una de estas tablas para ver su esquema.
Ahora puede consultar estas tablas en Athena con SQL.