本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
存取資料目錄
您可以使用 AWS Glue Data Catalog 來探索和瞭解您的資料。資料目錄提供一致的方式來維護結構描述定義、資料類型、位置和其他中繼資料。您可以使用下列方法存取「資料目錄」:
AWS Glue 控制台 — 您可以通過基於 Web 的用戶界面 AWS Glue 控制台訪問和管理數據目錄。主控台可讓您瀏覽和搜尋資料庫、表格及其關聯的中繼資料,以及建立、更新和刪除中繼資料定義。
AWS Glue 編目程式 — 爬蟲是自動掃描您的資料來源並使用中繼資料填入資料目錄的程式。您可以建立並執行爬取器,以探索和編目來自不同來源的資料,例如 Amazon S3、Amazon RDS、亞馬遜 DynamoDB 和與 JDB 相容的關聯式資料庫 (例如 MySQL 和 PostgreSQL),以及數個非來源 (例如雪花和 Google)。 Amazon CloudWatchAWS BigQuery
AWS Glue API — 您可以使用 AWS Glue API 以程式設計方式存取資料目錄。這些 API 可讓您透過程式設計方式與資料目錄互動,以實現與其他應用程式和服務的自動化和整合。
-
AWS Command Line Interface (AWS CLI) — 您可以使用 AWS CLI 從指令行存取和管理「資料目錄」。CLI 提供用於建立、更新和刪除中繼資料定義,以及查詢和擷取中繼資料資訊的命令。
-
與其他 AWS 服務整合 — 資料型錄與其他各種 AWS 服務整合,可讓您存取和使用目錄中儲存的中繼資料。例如,您可以使用 Amazon Athena 使用資料目錄中的中繼資料查詢資料來源,並用 AWS Lake Formation 於管理資料目錄資源的資料存取和控管。