本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
AWS Lake Formation 搭配 Amazon Redshift Spectrum 使用
Amazon Redshift Spectrum 可讓您在 Amazon S3 資料湖中查詢和擷取資料,而無需將資料載入 Amazon Redshift 叢集節點。
Redshift Spectrum 支援透過 Lake Formation 註冊啟用的外部 AWS Glue 資料目錄的兩種方式。
使用具有 Data Catalog 許可的叢集連接IAM角色
若要建立IAM角色,請遵循下列程序中所述的步驟。
-
使用設定為管理外部 AWS Glue Data Catalog 資源存取的聯合IAM身分
Redshift Spectrum 支援使用聯合身分查詢 Lake Formation IAM 資料表。IAM 身分可以是IAM使用者或IAM角色。如需 Redshift Spectrum 中IAM身分聯合的詳細資訊,請參閱使用聯合身分管理 Amazon Redshift 對本機資源的存取和 Redshift Spectrum 外部資料表。
透過 Lake Formation 與 Redshift Spectrum 整合,您可以在資料向 Lake Formation 註冊後定義資料表上的資料列、資料欄和儲存格層級存取控制許可。
如需詳細資訊,請參閱搭配 使用 Redshift Spectrum AWS Lake Formation。
Redshift Spectrum 支援 Lake Formation 受管外部結構描述資料表上的讀取或SELECT
查詢。
如需詳細資訊,請參閱建立 Redshift Spectrum 的外部結構描述。
支援交易資料表類型
此資料表列出 Redshift Spectrum 和適用的 Lake Formation 許可中支援的交易資料表格式。
資料表格式 | 描述和允許的操作 | Redshift Spectrum 支援 Lake Formation 許可 |
---|---|---|
Apache Hudi |
用於簡化增量資料處理和資料管道開發的格式。 Redshift Spectrum 支援在 Amazon S3 上使用 Apache Hudi Copy on Write (CoW 如需詳細資訊,請參閱為 Apache Hudi 中管理的資料建立外部資料表。 |
使用 Lake Formation 中的資料篩選和儲存格層級安全性 保護 Hudi 資料表,使用資料表、資料欄、資料列和儲存格層級許可。 |
Apache Iceberg |
一種開放的資料表格式,可管理大量檔案集合作為資料表,並支援現代分析資料湖操作,例如記錄層級插入、更新、刪除和時間移動查詢。 如需詳細資訊,請參閱搭配 Amazon Redshift 使用 Apache Iceberg 資料表。 |
Redshift Spectrum 支援 Apache Iceberg 資料表進行查詢。 |
Linux Foundation Delta Lake | Delta Lake 是一項開放原始碼專案,可協助實作 Amazon S3 或 Hadoop 分散式檔案系統 () 上常見的現代資料湖架構HDFS。 Redshift Spectrum 支援查詢 Delta Lake 資料表。如需詳細資訊,請參閱為 Delta Lake 中管理的資料建立外部資料表。 |
支援資料表、資料欄、資料列和儲存格層級許可。 |