Considerações sobre o Amazon EMR com o Lake Formation - Amazon EMR

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Considerações sobre o Amazon EMR com o Lake Formation

Considere o seguinte ao usar o Amazon EMR com. AWS Lake Formation

  • O controle de acesso no nível de tabela está disponível em clusters com versões 6.13 e superiores do Amazon EMR.

  • O controle de acesso refinado no nível de linha, coluna e célula está disponível em clusters com versões 6.15 e superiores do Amazon EMR.

  • Os usuários com acesso a uma tabela podem acessar todas as propriedades da tabela. Se você tiver controle de acesso baseado no Lake Formation em uma tabela, revise a tabela para garantir que as propriedades não contenham dados ou informações sigilosas.

  • Os clusters do Amazon EMR com Lake Formation não oferecem suporte ao retorno do Spark para o HDFS quando o Spark coleta estatísticas de tabelas. Isso normalmente ajuda a otimizar a performance da consulta.

  • As operações que oferecem suporte a controles de acesso baseados no Lake Formation com tabelas não governadas do Apache Spark incluem INSERT INTO e INSERT OVERWRITE.

  • As operações que oferecem suporte a controles de acesso baseados no Lake Formation com Apache Spark e Apache Hive incluem SELECT, DESCRIBE, SHOW DATABASE, SHOW TABLE, SHOW COLUMN e SHOW PARTITION.

  • O Amazon EMR não oferece suporte ao controle de acesso às seguintes operações baseadas no Lake Formation:

    • Grava em tabelas controladas

    • O Amazon EMR não oferece suporte a CREATE TABLE. O Amazon EMR 6.10.0 e versões superiores oferecem suporte a ALTER TABLE.

    • Instruções DML que não sejam comandos INSERT.

  • Há diferenças de performance entre a mesma consulta com e sem controle de acesso baseado no Lake Formation.

  • Você só pode usar o Amazon EMR com o Lake Formation para trabalhos do Spark.

  • A propagação de identidade confiável não é compatível com a hierarquia de vários catálogos no Glue Data Catalog. Para obter mais informações, consulte Trabalhando com uma hierarquia de vários catálogos no AWS Glue Data Catalog.