本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
将 Amazon EMR 与配合使用时,请考虑以下几点。 AWS Lake Formation
-
表级访问控制在 Amazon EMR 6.13 及更高版本的集群上可用。
-
行、列和单元格级别的精细访问控制在 Amazon EMR 6.15 及更高版本的集群上可用。
-
具有表访问权限的用户可以访问该表的所有属性。如果您对表具有基于 Lake Formation 的访问控制,则请查看该表以确保属性不包含任何敏感数据或信息。
-
当 Spark 收集表统计数据时,带有 Lake Formation 的 Amazon EMR 集群不支持 Spark 回退到 HDFS。这通常有助于优化查询性能。
-
通过不受监管的 Apache Spark 表支持基于 Lake Formation 的访问控制的操作包括
INSERT INTO
和INSERT OVERWRITE
。 -
通过 Apache Spark 和 Apache Hive 支持基于 Lake Formation 的访问控制的操作包括
SELECT
、DESCRIBE
、SHOW DATABASE
、SHOW TABLE
、SHOW COLUMN
和SHOW PARTITION
。 -
Amazon EMR 不支持对以下基于 Lake Formation 的操作进行访问控制:
-
写入受监管表
-
Amazon EMR 不支持
CREATE TABLE
。Amazon EMR 6.10.0 及更高版本支持ALTER TABLE
。 -
除
INSERT
命令之外的 DML 语句。
-
-
使用和不使用基于 Lake Formation 的访问控制的同一查询之间存在性能差异。
-
您只能将 Amazon EMR 与 Lake Formation 结合使用来执行 Spark 作业。
-
Glue 数据目录中的多目录层次结构不支持可信身份传播。有关更多信息,请参阅 AWS Glue 数据目录中的使用多目录层次结构。