本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon Redshift Spectrum 可讓您在 Amazon S3 資料湖中查詢和擷取資料,而無需將資料載入 Amazon Redshift 叢集節點。
Redshift Spectrum 支援兩種向 Lake Formation 啟用的外部 AWS Glue 資料目錄註冊方式。
使用具有 Data Catalog 許可的叢集連接 IAM 角色
若要建立 IAM 角色,請遵循下列程序中所述的步驟。
-
使用設定為管理外部 AWS Glue Data Catalog 資源存取的聯合 IAM 身分
Redshift Spectrum 支援使用聯合 IAM 身分查詢 Lake Formation 資料表。IAM 身分可以是 IAM 使用者或 IAM 角色。如需 Redshift Spectrum 中 IAM 身分聯合的詳細資訊,請參閱使用聯合身分管理 Amazon Redshift 對本機資源和 Redshift Spectrum 外部資料表的存取。
透過 Lake Formation 與 Redshift Spectrum 整合,您可以在向 Lake Formation 註冊資料後定義資料表上的資料列、資料欄和儲存格層級存取控制許可。
如需詳細資訊,請參閱搭配 Redshift Spectrum 使用 AWS Lake Formation。
Redshift Spectrum 支援 Lake Formation 受管外部結構描述資料表上的讀取或SELECT
查詢。
如需詳細資訊,請參閱建立 Redshift Spectrum 的外部結構描述。
支援交易資料表類型
此資料表列出 Redshift Spectrum 中支援的交易資料表格式和適用的 Lake Formation 許可。
資料表格式 | 描述和允許的操作 | Redshift Spectrum 支援的 Lake Formation 許可 |
---|---|---|
Apache Hudi |
用於簡化增量資料處理和資料管道開發的格式。 Redshift Spectrum 支援在 Amazon S3 上使用 Apache Hudi Copy on Write (CoW) 如需詳細資訊,請參閱為 Apache Hudi 中管理的資料建立外部資料表。 |
使用 Lake Formation 中的資料篩選和儲存格層級安全性 保護 Hudi 資料表,使用資料表、資料欄、資料列和儲存格層級許可。 |
Apache Iceberg |
一種開放的資料表格式,可管理大型檔案集合做為資料表,並支援現代分析資料湖操作,例如記錄層級插入、更新、刪除和時間移動查詢。 如需詳細資訊,請參閱搭配 Amazon Redshift 使用 Apache Iceberg 資料表。 |
Redshift Spectrum 支援 Apache Iceberg 資料表進行查詢。 |
Linux Foundation Delta Lake | Delta Lake 是一項開放原始碼專案,可協助實作常見於 Amazon S3 或 Hadoop 分散式檔案系統 (HDFS) 的現代資料湖架構。 Redshift Spectrum 支援查詢 Delta Lake 資料表。如需詳細資訊,請參閱為 Delta Lake 中管理的資料建立外部資料表。 |
支援資料表、資料欄、資料列和儲存格層級許可。 |