Trabalhando com outros AWS serviços - AWS Lake Formation

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Trabalhando com outros AWS serviços

AWS serviços como Amazon Athena AWS Glue, Amazon Redshift Spectrum e EMR Amazon podem ser AWS Lake Formation usados para acessar com segurança dados em locais do Amazon S3 registrados no Lake Formation. Com o Lake Formation, você pode definir e gerenciar permissões refinadas de controle de acesso (FGAC) para suas tabelas no. AWS Glue Data Catalog Cada um desses AWS serviços é um chamador confiável para o Lake Formation, e o Lake Formation fornece acesso aos dados armazenados no Amazon S3 por meio de credenciais temporárias. Para obter mais informações, consulte Como funciona a integração de aplicações do Lake Formation.

Para aproveitar esses recursos, o Lake Formation exige que você primeiro registre a localização do Amazon S3 e atribua permissões apropriadas ao diretor para acessar IAM a tabela, o banco de dados e a localização do Amazon S3. Para obter mais informações, consulte, Gerenciando permissões do Lake Formation.

As tabelas a seguir listam os tipos de permissões do Lake Formation suportadas pelo Amazon Athena, AWS Glue Amazon e Amazon EMR Redshift Spectrum para acessar dados AWS Glue de tabelas padrão e tabelas transacionais (Apache Iceberg, Apache Hudi e Linux Foundation Delta Lake) com dados armazenados no Amazon S3 e metadados de tabelas no catálogo de dados.

AWS serviços e tipos de permissão compatíveis para tabelas e exibições AWS Glue padrão
AWS serviço Permissões em nível de tabela Permissões em nível de coluna Permissões em nível de linha e célula
Athena SQL

Acesso de leitura/gravação

Acesso de leitura Acesso de leitura
Athena Spark

Sem compatibilidade

Sem compatibilidade

Sem compatibilidade

Redshift Spectrum em um cluster provisionado ou Amazon Redshift sem servidor

Acesso de leitura/gravação Acesso de leitura Acesso de leitura

Apache Spark na Amazon EMR () EC2

Acesso de leitura/gravação Acesso de leitura Acesso de leitura
Apache Hive na Amazon EMR () EC2 Acesso de leitura/gravação Acesso de leitura Sem compatibilidade
Apache Spark sem servidor EMR Acesso de leitura/gravação Acesso de leitura Acesso de leitura
Apache Hive sem servidor EMR Sem compatibilidade Sem compatibilidade Sem compatibilidade
Amazon EMR em EKS Sem compatibilidade Sem compatibilidade Sem compatibilidade
AWS Glue ETL Acesso de leitura/gravação Sem compatibilidade Sem compatibilidade
Considerações e limitações
  • O Athena Spark não é compatível com a consulta de tabelas do Catálogo de Dados com permissões do Lake Formation.

  • Os usuários do Athena podem ler fontes de dados protegidas usando as permissões do Lake Formation ao habilitar a federação SAML baseada em SAML 2.0. SAMLos usuários podem inserir dados nas tabelas do Parquet.

  • O Apache Spark no EMR Serverless não oferece suporte à consulta de visualizações do Catálogo de Dados.

  • O Apache Hive on EMR Serverless não oferece suporte à consulta de tabelas com permissões do Lake Formation.

  • AWS Glue ETLrequer acesso total a toda a tabela enquanto busca dados da localização subjacente do Amazon S3. AWS Glue ETLo trabalho falhará se você aplicar permissões em nível de coluna em uma tabela.

AWS serviços e tipos de permissão compatíveis para formatos de tabela transacional
AWS serviço Iceberg Hudi Lago Delta (nativo) Delta Lake (tabelas de links simbólicos)

Athena SQL

Oferece suporte à leitura de tabelas com permissões em nível de tabela, coluna, linha e célula. As operações de gravação exigem acesso total à tabela.

Suporta operações de leitura e criação em tabelas com permissões em nível de tabela, coluna, linha e célula. As operações de gravação não são suportadas.

O Athena (versão 3 do mecanismo) suporta a leitura de tabelas nativas do Delta Lake com permissões de tabela, coluna, linha e célula. As operações de gravação não são suportadas.

O Athena (versão 3 do mecanismo) suporta a leitura de tabelas de links simbólicos Delta Lake com permissões de tabela, coluna, linha e célula. As operações de gravação não são suportadas.

Redshift Spectrum em um cluster provisionado

Oferece suporte à leitura de tabelas com permissões em nível de tabela, coluna, linha e célula. As operações de gravação não são suportadas.

Oferece suporte à leitura de tabelas com permissões em nível de tabela, coluna, linha e célula. As operações de gravação não são suportadas.

Não suportado Suporta a leitura de tabelas do Delta Lake por meio de manifesto de links simbólicos com permissões em nível de tabela, coluna, linha e célula. As operações de gravação não são suportadas.
Apache Spark na Amazon EMR () EC2 Oferece suporte à leitura de tabelas com permissões em nível de tabela, coluna, linha e célula. As operações de gravação exigem acesso total à tabela. Oferece suporte à leitura de tabelas com permissões em nível de tabela, coluna, linha e célula. As operações de gravação exigem acesso total à tabela.

Oferece suporte à leitura de tabelas com permissões em nível de tabela, coluna, linha e célula. As operações de gravação não são suportadas.

Oferece suporte à leitura de tabelas com permissões em nível de tabela, coluna, linha e célula. As operações de gravação exigem acesso total à tabela.
AWS Glue ETL Suporta leitura/gravação em tabelas com permissões em nível de tabela. Suporta leitura/gravação em tabelas com permissões em nível de tabela. Suporta leitura/gravação em tabelas com permissões em nível de tabela. Suporta leitura/gravação em tabelas com permissões em nível de tabela.