本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
您可以使用 AWS Glue Data Catalog (資料目錄) 來探索和了解您的資料。Data Catalog 提供一致的方法來維護結構描述定義、資料類型、位置和其他中繼資料。您可以使用下列方法存取 Data Catalog:
AWS Glue 主控台 – 您可以透過 AWS Glue 主控台存取和管理 Data Catalog,這是 Web 型使用者介面。主控台可讓您瀏覽和搜尋資料庫、資料表及其相關聯的中繼資料,以及建立、更新和刪除中繼資料定義。
AWS Glue 編目程式 – 爬蟲程式是自動掃描資料來源並將中繼資料填入 Data Catalog 的程式。您可以建立和執行爬蟲程式,從各種來源探索和分類資料,例如 Amazon S3、Amazon RDS、Amazon DynamoDB Amazon CloudWatch、 和 JDBC 相容關聯式資料庫,例如 MySQL、PostgreSQL,以及數個非AWS 來源,例如 Snowflake 和 Google BigQuery。
AWS Glue APIs – 您可以使用 AWS Glue APIs 以程式設計方式存取 Data Catalog。這些 APIs 可讓您以程式設計方式與 Data Catalog 互動,進而實現自動化,並與其他應用程式和服務整合。
-
AWS Command Line Interface (AWS CLI) – 您可以使用 從命令列 AWS CLI 存取和管理 Data Catalog。CLI 提供建立、更新和刪除中繼資料定義的命令,以及查詢和擷取中繼資料資訊。
-
與其他 AWS 服務的整合 – Data Catalog 與其他各種 AWS 服務整合,可讓您存取和使用存放在 目錄中的中繼資料。例如,您可以使用 Amazon Athena 使用 Data Catalog 中的中繼資料來查詢資料來源,並使用 AWS Lake Formation 管理 Data Catalog 資源的資料存取和管理。