Usando AWS Lake Formation com o Amazon Redshift Spectrum - AWS Lake Formation

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Usando AWS Lake Formation com o Amazon Redshift Spectrum

O Amazon Redshift Spectrum permite que você consulte e recupere dados em data lakes do Amazon S3 sem que seja necessário carregar dados em nós de cluster do Amazon Redshift.

O Redshift Spectrum oferece suporte a duas formas de registrar um catálogo de AWS Glue dados externo habilitado com o Lake Formation.

Com a integração do Lake Formation com o Redshift Spectrum, você pode definir permissões de controle de acesso em nível de linha, coluna e célula nas tabelas depois que seus dados forem registrados no Lake Formation.

Para obter mais informações, consulte Usando o Redshift Spectrum com. AWS Lake Formation

O Redshift Spectrum suporta leituras ou consultas SELECT nas tabelas de esquema externo gerenciadas pelo Lake Formation.

Para obter mais informações, confira Como criar esquemas externos para Redshift Spectrum.

Suporte para tipos de tabelas transacionais

Esta tabela lista os formatos de tabela transacional suportados no Redshift Spectrum e as permissões aplicáveis do Lake Formation.

Formatos de tabela compatíveis
Formato da tabela Descrição e operações permitidas Permissões do Lake Formation compatíveis com o Redshift Spectrum

Apache Hudi

Um formato usado para simplificar o processamento incremental de dados e o desenvolvimento de pipelines de dados.

O Redshift Spectrum suporta operações de gravação de inserção, exclusão e inserção usando o formato de tabela Apache Hudi Copiar na Gravação (CoW) no Amazon S3.

Para obter mais informações, consulte Criação de tabelas externas para dados gerenciados no Apache Hudi.

Use Filtragem de dados e segurança por célula no Lake Formation para proteger a tabela Hudi com permissões no nível de tabela, coluna, linha e célula.

Apache Iceberg

Um formato de tabela aberto que gerencia grandes coleções de arquivos como tabelas e oferece suporte a operações analíticas modernas de data lake, como inserção, atualização, exclusão e consultas de viagem no tempo em nível de registro.

Para obter mais informações, confira Como usar tabelas do Apache Iceberg com o Amazon Redshift.

O Redshift Spectrum oferece suporte a tabelas do Apache Iceberg para consultas.

Linux Foundation Delta Lake O Delta Lake é um projeto de código aberto que ajuda a implementar arquiteturas modernas de data lake comumente criadas no Amazon S3 ou no Hadoop Distributed File System (). HDFS

O Redshift Spectrum oferece suporte à consulta de tabelas Delta Lake. Para obter mais informações, consulte Criação de tabelas externas para dados gerenciados no Delta Lake.

Suporte para permissões em nível de tabela, coluna, linha e célula.

Recursos adicionais