本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Lake Form EMR ation 的亚马逊注意事项
将 Amazon EMR 与配合使用时,请考虑以下几点 AWS Lake Formation。
-
表级访问控制适用于采用 Amazon 6.13 及更高EMR版本的集群。
-
在 Amazon 6.15 及更高EMR版本的集群中,可使用行、列和单元级别的@@ 精细访问控制。
-
具有表访问权限的用户可以访问该表的所有属性。如果您对表具有基于 Lake Formation 的访问控制,则请查看该表以确保属性不包含任何敏感数据或信息。
-
带有 Lake Formation 的亚马逊EMR集群不支持 Spark 回退到 Spark 收集表格统计数据HDFS时的后备模式。这通常有助于优化查询性能。
-
通过不受监管的 Apache Spark 表支持基于 Lake Formation 的访问控制的操作包括
INSERT INTO
和INSERT OVERWRITE
。 -
通过 Apache Spark 和 Apache Hive 支持基于 Lake Formation 的访问控制的操作包括
SELECT
、DESCRIBE
、SHOW DATABASE
、SHOW TABLE
、SHOW COLUMN
和SHOW PARTITION
。 -
亚马逊EMR不支持对以下基于 Lake Formation 的操作进行访问控制:
-
写入受监管表
-
亚马逊EMR不支持
CREATE TABLE
。亚马逊 EMR 6.10.0 及更高版本支持。ALTER TABLE
-
DML
INSERT
命令以外的语句。
-
-
使用和不使用基于 Lake Formation 的访问控制的同一查询之间存在性能差异。
-
你只能使用EMR带有 Lake Formation 的 Amazon 来完成 Spark 任务。