As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
O Amazon Redshift Spectrum permite que você consulte e recupere dados em data lakes do Amazon S3 sem que seja necessário carregar dados em nós de cluster do Amazon Redshift.
O Redshift Spectrum oferece suporte a duas formas de registrar um catálogo de AWS Glue dados externo habilitado com o Lake Formation.
Como usar um perfil do IAM anexado ao cluster que tenha permissão para acessar o catálogo de dados
Para criar um perfil do IAM, siga as etapas descritas no procedimento abaixo.
-
Como usar identidade federada do IAM configurada para gerenciar o acesso a recursos AWS Glue Data Catalog externos
O Redshift Spectrum suporta a consulta de tabelas do Lake Formation usando identidades federadas do IAM. As identidades do IAM podem ser um usuário do IAM ou um perfil do IAM. Para obter mais informações sobre a federação de identidades IAM no Redshift Spectrum, consulte Como usar uma identidade federada para gerenciar o acesso do Amazon Redshift a recursos locais e tabelas externas do Redshift Spectrum.
Com a integração do Lake Formation com o Redshift Spectrum, você pode definir permissões de controle de acesso em nível de linha, coluna e célula nas tabelas depois que seus dados forem registrados no Lake Formation.
Para obter mais informações, consulte Usando o Redshift Spectrum com. AWS Lake Formation
O Redshift Spectrum suporta leituras ou consultas SELECT
nas tabelas de esquema externo gerenciadas pelo Lake Formation.
Para obter mais informações, confira Como criar esquemas externos para Redshift Spectrum.
Suporte para tipos de tabelas transacionais
Esta tabela lista os formatos de tabela transacional suportados no Redshift Spectrum e as permissões aplicáveis do Lake Formation.
Formato da tabela | Descrição e operações permitidas | Permissões do Lake Formation compatíveis com o Redshift Spectrum |
---|---|---|
Apache Hudi |
Um formato usado para simplificar o processamento incremental de dados e o desenvolvimento de pipelines de dados. O Redshift Spectrum suporta operações de gravação de inserção, exclusão e inserção usando o formato de tabela Apache Hudi Copiar na Gravação (CoW) Para obter mais informações, consulte Criação de tabelas externas para dados gerenciados no Apache Hudi. |
Use Filtragem de dados e segurança por célula no Lake Formation para proteger a tabela Hudi com permissões no nível de tabela, coluna, linha e célula. |
Apache Iceberg |
Um formato de tabela aberto que gerencia grandes coleções de arquivos como tabelas e oferece suporte a operações analíticas modernas de data lake, como inserção, atualização, exclusão e consultas de viagem no tempo em nível de registro. Para obter mais informações, confira Como usar tabelas do Apache Iceberg com o Amazon Redshift. |
O Redshift Spectrum oferece suporte a tabelas do Apache Iceberg para consultas. |
Linux Foundation Delta Lake | O Delta Lake é um projeto de código aberto que ajuda a implementar arquiteturas modernas de data lake, geralmente construídas no Amazon S3 ou no Sistema de Arquivos Distribuído do Hadoop (HDFS). O Redshift Spectrum oferece suporte à consulta de tabelas Delta Lake. Para obter mais informações, consulte Criação de tabelas externas para dados gerenciados no Delta Lake. |
Suporte para permissões em nível de tabela, coluna, linha e célula. |