使用 Lake Form EMR ation 的亚马逊注意事项 - Amazon EMR

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Lake Form EMR ation 的亚马逊注意事项

将 Amazon EMR 与配合使用时,请考虑以下几点 AWS Lake Formation。

  • 表级访问控制适用于采用 Amazon 6.13 及更高EMR版本的集群。

  • 在 Amazon 6.15 及更高EMR版本的集群中,可使用行、列和单元级别的@@ 精细访问控制

  • 具有表访问权限的用户可以访问该表的所有属性。如果您对表具有基于 Lake Formation 的访问控制,则请查看该表以确保属性不包含任何敏感数据或信息。

  • 带有 Lake Formation 的亚马逊EMR集群不支持 Spark 回退到 Spark 收集表格统计数据HDFS时的后备模式。这通常有助于优化查询性能。

  • 通过不受监管的 Apache Spark 表支持基于 Lake Formation 的访问控制的操作包括 INSERT INTOINSERT OVERWRITE

  • 通过 Apache Spark 和 Apache Hive 支持基于 Lake Formation 的访问控制的操作包括 SELECTDESCRIBESHOW DATABASESHOW TABLESHOW COLUMNSHOW PARTITION

  • 亚马逊EMR不支持对以下基于 Lake Formation 的操作进行访问控制:

    • 写入受监管表

    • 亚马逊EMR不支持CREATE TABLE。亚马逊 EMR 6.10.0 及更高版本支持。ALTER TABLE

    • DMLINSERT命令以外的语句。

  • 使用和不使用基于 Lake Formation 的访问控制的同一查询之间存在性能差异。

  • 你只能使用EMR带有 Lake Formation 的 Amazon 来完成 Spark 任务。