本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS Lake Formation 使用 AWS Glue Data Catalog 以資料庫和表格的形式存放 Amazon S3 資料的中繼資料。資料表儲存基礎資料的相關資訊,包括結構描述資訊、分割區資訊和資料位置。數據庫是表的集合。資料目錄也包含資源連結,這些連結是外部帳戶中共用資料庫和表格的連結,可用於跨帳戶存取資料湖中的資料。每個 AWS 帳戶每個 AWS 區域都有一個資料目錄。
Lake Formation 提供關聯式資料庫管理系統 (RDBMS) 許可模型,可授與或撤銷資料目錄中資料庫、表格和欄的存取權,以及 Amazon S3 中的基礎資料。
在瞭解 Lake Formation 權限模型的詳細資訊之前,先檢閱下列背景資訊會很有幫助:
-
由 Lake Form 管理的資料湖位於 Amazon Simple Storage Service (Amazon S3) 的指定位置。
-
Lake Formation 會維護一個資料目錄,其中包含有關要匯入資料湖的來源資料的中繼資料,例如日誌和關聯式資料庫中的資料,以及 Amazon S3 中資料湖中資料的相關資料。中繼資料會組織為資料庫和資料表。中繼資料表包含結構描述、位置、分割區及其他關於它們所代表之資料的資訊。元數據庫是表的集合。
-
「Lake Formation 資料目錄」與使用的「資料目錄」相同AWS Glue。您可以使用AWS Glue編目器建立「資料目錄」表格,也可以使用AWS Glue擷取、轉換和載入 (ETL) 工作將基礎資料填入資料湖中。
-
「資料目錄」中的資料庫和表格稱為「資料目錄」資源。資料目錄中的表稱為中繼資料表,以區分資料來源中的表格或 Amazon S3 中的表格資料。中繼資料表在 Amazon S3 或資料來源中指向的資料稱為基礎資料。
-
主體是指使用者或角色、Amazon QuickSight 使用者或群組、透過 SAML 提供者向 Lake Formation 進行驗證的使用者或群組,或針對跨帳戶存取控制、 AWS 帳戶 ID、組織 ID 或組織單位 ID。
-
AWS Glue檢索器會建立中繼資料表,但您也可以使用 Lake Formation 主控台、API 或 AWS Command Line Interface (AWS CLI) 手動建立中繼資料表格。建立中繼資料表時,您必須指定位置。當您建立資料庫時,該位置是選擇性的。表格位置可以是 Amazon S3 位置或資料來源位置,例如 Amazon Relational Database Service 服務 (Amazon RDS) 資料庫。資料庫位置一律是 Amazon S3 位置。
-
與 Lake Formation 整合的服務 (例如 Amazon Athena 和 Amazon Redshift) 可以存取資料目錄以取得中繼資料並檢查執行查詢的授權。如需整合式服務的完整清單,請參閱AWS 服務與 Lake Formation 的整合。