使用 AWS Glue 爬蟲程式建立資料目錄 - Amazon AppStream 2.0

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

使用 AWS Glue 爬蟲程式建立資料目錄

AWS Glue 爬蟲程式在執行時,會建立對應至工作階段和應用程式報告的結構的資料目錄和結構描述。每次將新報告存放在 Amazon S3 儲存貯體時,您必須執行爬蟲程式,以使用新報告的資料來更新 AWS Glue 資料目錄。

注意

費用可能適用於 AWS Glue 爬蟲程式的執行。如需詳細資訊,請參閱 AWS Glue 定價

  1. 在 開啟 AWS Glue 主控台https://console.aws.amazon.com/glue/

  2. 選擇您已訂閱用量報告的 AWS 區域。

  3. 選取名為 的爬蟲程式旁的核取方塊appstream-usage-sessions-crawler,然後選擇執行爬蟲程式 。針對名為 的爬蟲程式重複此步驟appstream-usage-apps-crawler

    執行這些步驟會執行爬蟲程式,並排程它們根據 AWS CloudFormation 堆疊中指定的排程自動執行。

  4. 兩個爬蟲程式都執行完後,在導覽窗格中選擇 Databases (資料庫)。隨即會顯示代表用量報告的 appstream-usage 資料庫。此資料庫是在 appstream-usage-sessions-crawlerappstream-usage-apps-crawler執行時建立 AWS Glue 的資料目錄。

  5. 若要檢視資料庫中的表格,請選擇 appstream-usage > Tables (表格)。隨即會顯示兩個表格 (應用程式工作階段),分別代表應用程式和工作階段用量報告。選擇任一表格即可檢視其結構描述。

    您現在可以使用 在 Athena 中查詢這些資料表SQL。