本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
這 AWS Glue Data Catalog 是一個中央中繼資料儲存庫,可存放 Amazon S3 資料集的結構化和操作中繼資料。有效管理資料型錄對於維護資料品質、效能、安全性和控管至關重要。
透過瞭解並套用這些資料目錄管理實務,您可以確保中繼資料隨著資料環境的發展保持正確、高效能、安全且受到妥善管理。
本節涵蓋資料目錄管理的下列層面:
更新資料表結構定義和資料分割隨著資料的發展,您可能需要更新資料目錄中定義的資料表結構定義或資料分割結構。如需如何使用 AWS Glue ETL 以程式設計方式進行這些更新的詳細資訊,請參閱更新結構描述,並使用 在 Data Catalog 中新增分割區 AWS Glue ETL 任務。
管理資料欄統計資料:精確的資料欄統計資料有助於最佳化查詢計畫並 如需如何產生、更新和管理資料行統計資料的詳細資訊,請參閱使用資料欄統計資料最佳化查詢效能。
加密資料目錄若要保護敏感的中繼資料,您可以使用 AWS Key Management Service (AWS KMS) 加密資料目錄。本節說明如何啟用和管理資料目錄的加密。
使用 AWS Lake Formation Lake Formation 保護資料目錄可提供資料湖安全性和存取控制的全方位方法。您可以使用 Lake Formation 來保護和管理對資料目錄和基礎資料的存取。