本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS Lake Formation 與 Amazon Redshift Spectrum 一起使用
Amazon Redshift Spectrum 可讓您查詢和擷取 Amazon S3 資料湖中的資料,而無需將資料載入 Amazon Redshift 叢集節點。
Redshift 頻譜支持兩種註冊啟用 Lake Formation 的外部 AWS Glue 數據目錄的方法。
使用具有資料目錄權限的叢集連接IAM角色
若要建立IAM角色,請遵循下列程序中所述的步驟。
若要使用 AWS Glue Data Catalog 已啟IAM用的功能建立 Amazon Redshift 的角色 AWS Lake Formation
-
使用已設定來管理外部 AWS Glue Data Catalog 資源存取權的同盟IAM身分
Redshift 頻譜支援使用聯合身分IAM查詢 Lake Formation 表。IAM識別可以是使IAM用者或IAM角色。如需 Redshift 頻譜中聯合IAM身分的詳細資訊,請參閱使用聯合身分管理 Amazon Redshift 對本機資源的存取和 Redshift 頻譜外部表格。
透過 Lake Formation 與 Redshift Spectrum 整合,您可以在資料向 LLake Formation Form 註冊後,在資料表上定義列、欄和儲存格層級的存取控制權限。
如需詳細資訊,請參閱搭 AWS Lake Formation配使用 Redshift 光譜。
Redshift 頻譜支援對 Lake Formation 管理的外部結構描述表進行讀取或SELECT
查詢。
如需詳細資訊,請參閱建立 Redshift 頻譜的外部結構描述。
Support 交易資料表類型
此表格列出 Redshift 頻譜支援的交易表格格式,以及適用的 Lake Formation 權限。
支援的表格格式 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
資料表格式 | 說明和允許的作業 | Redshift 頻譜中支持 Lake Formation 權限 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Apache Hudi |
用於簡化增量資料處理和資料管線開發的格式。 Redshift 頻譜支援在 Amazon S3 上使用阿帕奇胡迪複製 (CoW) 表格式的插入、刪除和更新寫 如需詳細資訊,請參閱針對在 Apache Hudi 中管理的資料建立外部資料表。 |
用於使用資料表、欄、列和儲存格層級權限Lake Formation 中的數據過濾和細胞級安全來保護 Hudi 資料表的安全。 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Apache Iceberg |
一種開放式資料表格式,可將大量檔案集合作為資料表進行管理,並支援現代化的分析資料湖作業,例如記錄層級的插入、更新、刪除和時間旅行查詢。 如需詳細資訊,請參閱將 Apache 冰山表與 Amazon Redshift 搭配使用。 |
Redshift 頻譜支持阿帕奇冰山表進行查詢。 |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Linux Foundation Delta Lake | Delta 湖是一個開放原始碼專案,可協助實作通常在 Amazon S3 或 Hadoop 分散式檔案系統 (HDFS) 上建置的現代化資料湖架構。 Redshift 頻譜支援查詢三角洲湖資料表。如需詳細資訊,請參閱為在 Delta Lake 中管理的資料建立外部資料表。 |
支援資料表、欄、列和儲存格層級權限。 |