

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用 AWS Glue 爬蟲程式建立資料目錄
<a name="configure-custom-reports-create-data-catalog"></a>

 AWS Glue 爬蟲程式在執行時，會建立對應至工作階段和應用程式報告結構的資料目錄和結構描述。每次將新報告存放在 Amazon S3 儲存貯體時，您必須執行爬蟲程式，以使用新報告的資料來更新 AWS Glue Data Catalog。

**注意**  
執行 AWS Glue 爬蟲程式可能需要付費。如需詳細資訊，請參閱[AWS Glue 定價](https://aws.amazon.com/glue/pricing/)。

1. 在 https：//[https://console.aws.amazon.com/glue/](https://console.aws.amazon.com/glue/) 開啟 AWS Glue 主控台。

1. 選擇您已訂閱用量報告的 AWS 區域。

1. 選取 **appstream-usage-sessions-crawler** 爬蟲程式旁的核取方塊，然後選擇 **Run crawler (執行爬蟲程式)**。對名為 **appstream-usage-apps-crawler** 的爬蟲程式重複這個步驟。

   執行這些步驟會執行爬蟲程式，並將它們排程為根據 CloudFormation 堆疊中指定的排程自動執行。

1. 兩個爬蟲程式都執行完後，在導覽窗格中選擇 **Databases (資料庫)**。隨即會顯示代表用量報告的 **appstream-usage** 資料庫。此資料庫是在執行 **appstream-usage-sessions-crawler** 和 **appstream-usage-apps-crawler** 時建立的 AWS Glue Data Catalog。

1. 若要檢視資料庫中的表格，請選擇 **appstream-usage** > **Tables (表格)**。隨即會顯示兩個表格 (**應用程式**和**工作階段**)，分別代表應用程式和工作階段用量報告。選擇任一表格即可檢視其結構描述。

   您現在可以使用 SQL 在 Athena 中查詢這些資料表。