Compartilhamento de dados no Amazon Redshift - Amazon Redshift

Compartilhamento de dados no Amazon Redshift

Com o Amazon Redshift, é possível compartilhar dados em tempo real entre clusters do Amazon Redshift ou com outros serviços da AWS. O compartilhamento de dados permite que você compartilhe dados em tempo real, sem precisar criar uma cópia ou movê-la. Os administradores de banco de dados e engenheiros de dados podem usar o compartilhamento de dados para fornecer acesso seguro e somente leitura aos dados para fins de analytics, mantendo o controle sobre os dados. Os analistas de dados, profissionais de business intelligence e cientistas de dados podem utilizar dados compartilhados para obter insights sem duplicar ou mover dados. Casos de uso comuns incluem compartilhar dados com parceiros, permitir análises multifuncionais e facilitar a democratização de dados dentro de uma organização. As seções a seguir apresentam detalhes da configuração e do gerenciamento do compartilhamento de dados no Amazon Redshift.

Com o compartilhamento de dados do Amazon Redshift, você pode compartilhar com segurança o acesso de leitura a dados em tempo real em clusters do Amazon Redshift, grupos de trabalho, Contas da AWS e Regiões da AWS sem mover ou copiar manualmente os dados. Como os dados ainda estão ativos, todos os usuários podem ver as informações mais atualizadas e consistentes no Amazon Redshift assim que elas são atualizadas.

É possível compartilhar dados entre clusters provisionados, grupos de trabalho sem servidor, zonas de disponibilidade, Contas da AWS e Regiões da AWS. Você pode compartilhar entre tipos de cluster, bem como entre clusters provisionados e sem servidor.

Você pode compartilhar objetos de banco de dados de leituras e gravações em clusters do Amazon Redshift diferentes ou grupos de trabalho do Amazon Redshift Serverless dentro da mesma Conta da AWS ou de uma Conta da AWS para outra. Você também pode gravar dados em várias regiões. Você pode conceder permissões como SELECT, INSERT e UPDATE para tabelas diferentes e USAGE e CREATE para esquemas diferentes. Os dados permanecem ativos e disponíveis para todos os warehouses assim que uma transação de gravação é confirmada.

Para obter mais informações sobre como configurar recursos para compartilhamento de dados na faixa PREVIEW_2023, consulte Compartilhamento de dados de leitura e gravação em uma Conta da AWS ou em várias contas (visualização).

nota

As gravações em vários data warehouses por meio do compartilhamento de dados não estão disponíveis em clusters ra3.xlplus no momento. Para usar esse recurso, crie clusters ra3.4xl, clusters ra3.16xl ou grupos de trabalho do Amazon Redshift sem servidor.

Considerações ao usar o compartilhamento de dados no Amazon Redshift

Veja as considerações a seguir para trabalhar com o compartilhamento de dados do Amazon Redshift. Para obter informações sobre limitações de compartilhamento de dados, consulte Limitações do compartilhamento de dados.

  • O compartilhamento de dados entre regiões inclui cobranças adicionais de transferência de dados entre regiões. Essas cobranças de transferência de dados não se aplicam na mesma região, somente entre regiões. Para ter mais informações, consulte Gerenciar o controle de custos para compartilhamento de dados entre regiões.

  • Ao ler dados de uma unidade de compartilhamento de dados, você permanece conectado ao banco de dados do cluster local. Consulte mais informações sobre configuração e leitura de um banco de dados criado a partir de uma unidade de compartilhamento de dados em Consulta de objetos da unidade de compartilhamento de dados e Visões materializadas em tabelas externas de data lake no Amazon Redshift Spectrum.

  • O consumidor é cobrado por todas as taxas de computação e transferência de dados entre regiões necessárias para consultar os dados do produtor. O produtor é cobrado pelo armazenamento subjacente de dados em seu cluster provisionado ou namespace sem servidor.

  • A performance das consultas em dados compartilhados depende da capacidade computacional dos clusters de consumidores.

Gerenciamento de criptografia de cluster para compartilhamento de dados

Para compartilhar dados de uma Conta da AWS, os clusters de produtor e de consumidor devem ser criptografados.

No Amazon Redshift, você pode ativar a criptografia de banco de dados para seus clusters para ajudar a proteger os dados em repouso. Quando você ativar a criptografia de um cluster, os blocos de dados e os metadados do sistema serão criptografados para o cluster e os respectivos snapshots. É possível ativar a criptografia ao iniciar o cluster ou modificar um cluster não criptografado para usar criptografia do AWS Key Management Service (AWS KMS). Para obter mais informações sobre a criptografia de banco de dados do Amazon Redshift, consulte “Criptografia de banco de dados do Amazon Redshift” no Guia de gerenciamento de clusters do Amazon Redshift.

Para proteger dados em trânsito, todos os dados são criptografados em trânsito por meio do esquema de criptografia do cluster de produtor. O cluster de consumidor adota esse esquema de criptografia quando os dados são carregados. Em seguida, o cluster de consumidor opera como um cluster criptografado normal. As comunicações entre o produtor e o consumidor também são criptografadas usando um esquema de chave compartilhada. Para obter mais informações sobre a criptografia em trânsito, consulte Criptografia em trânsito.

Limitações do compartilhamento de dados

Veja as seguintes limitações ao trabalhar com datashares no Amazon Redshift:

  • É possível usar o compartilhamento de dados com todos os tipos de cluster RA3 provisionados e o Amazon Redshift sem servidor. Não é compatível com outros tipos de cluster.

  • Se os clusters do produtor e do consumidor e os namespaces sem servidor estiverem na mesma conta, eles deverão ter o mesmo status de criptografia (descriptografado ou criptografado). Em todos os outros casos, incluindo as unidades de compartilhamento de dados gerenciadas pelo Lake Formation, tanto o consumidor quanto o produtor devem ser criptografados. Isso é para fins de segurança. No entanto, eles não precisam compartilhar a mesma chave de criptografia.

  • Você só pode compartilhar UDFs de SQL por meio de unidades de compartilhamento de dados. UDFs Python e Lambda não são compatíveis.

  • Se o banco de dados de produtor tiver um agrupamento específico, use as mesmas configurações de agrupamento para o banco de dados de consumidor.

  • O Amazon Redshift não é compatível com a adição de esquemas externos, tabelas ou visualizações de vinculação tardia em tabelas externas a unidades de compartilhamento de dados.

  • O Amazon Redshift não oferece suporte a funções definidas pelo usuário SQL aninhadas em clusters de produtores.

  • O Amazon Redshift não oferece suporte ao compartilhamento de tabelas com chaves de classificação intercaladas e exibições que se referem a tabelas com chaves de classificação intercaladas.

  • Os consumidores não podem adicionar objetos de unidade de compartilhamento de dados a outra unidade de compartilhamento de dados. Além disso, os consumidores não podem adicionar visualizações que fazem referência a objetos de unidade de compartilhamento de dados em outra unidade de compartilhamento de dados.

  • O Amazon Redshift não é compatível com o acesso a objetos de unidade de compartilhamento de dados que tiveram um evento de DDL simultâneo entre a preparação e a execução do acesso.

  • O Amazon Redshift não é compatível com o compartilhamento de procedimentos armazenados por meio de unidades de compartilhamento de dados.

  • O Amazon Redshift não comporta o compartilhamento de visualizações do sistema de metadados e de tabelas do sistema.

Regiões em que o compartilhamento de dados está disponível

A tabela a seguir lista a disponibilidade de recursos de compartilhamento de dados.

Região Compartilhamento de dados na mesma região Compartilhamento de dados entre regiões Compartilhamentos de dados controlados pelo AWS Lake Formation
Leste dos EUA (Norte da Virgínia) (us-east-1) Sim Sim Sim
Leste dos EUA (Ohio) (us-east-2) Sim Sim Sim
Oeste dos EUA (Norte da Califórnia) (us-west-1) Sim Sim Sim
Oeste dos EUA (Oregon) (us-west-2) Sim Sim Sim
Ásia-Pacífico (Hong Kong) (ap-east-1) Sim Não Não
Ásia-Pacífico (Mumbai) (ap-south-1) Sim Sim Sim
Ásia-Pacífico (Hyderabad) (ap-south-2) Sim Não Não
Ásia Pacific (Tóquio) (ap-northeast-1) Sim Sim Sim
Ásia-Pacífico (Singapura) (ap-southeast-1) Sim Sim Sim
Ásia-Pacífico (Sydney) (ap-southeast-2) Sim Sim Sim
Ásia-Pacífico (Jacarta); (ap-southeast-3) Sim Não Não
Ásia-Pacífico (Melbourne) (ap-southeast-4) Sim Não Não
Ásia-Pacífico (Seul) (ap-northeast-2) Sim Sim Sim
Ásia-Pacífico (Osaka) (ap-northeast-3) Sim Não Não
China (Pequim) (cn-north-1) Sim Não Não
China (Ningxia) (cn-northwest-1) Sim Não Não
África (Cidade do Cabo) (af-south-1) Sim Não Não
Oeste do Canadá (Calgary) ca-west-1 Sim Não Não
Canadá (Central) (ca-central-1) Sim Sim Sim
Europa (Frankfurt) (eu-central-1) Sim Sim Sim
Europa (Zurique) (eu-central-2) Sim Não Não
Europa (Irlanda) (eu-west-1) Sim Sim Sim
Europa (Londres) (eu-west-2) Sim Sim Sim
Europa (Paris) (eu-west-3) Sim Sim Sim
UE (Milão) (eu-south-1) Sim Não Não
Europa (Espanha) (eu-south-2) Sim Não Não
UE (Estocolmo) (eu-north-1) Sim Sim Sim
Oriente Médio (EAU) (me-central-1) Sim Não Não
Oriente Médio (Bahrein) (me-south-1) Sim Não Não
Israel (Tel Aviv) (il-central-1) Sim Não Não
América do Sul (São Paulo) (sa-east-1) Sim Sim Sim
AWS GovCloud (Leste dos EUA) (us-gov-east-1) Sim Não Sim
AWS GovCloud (Oeste dos EUA) (us-gov-wast-1) Sim Não Sim

Disponibilidade regional de gravações em vários warehouses para compartilhamento de dados

Na faixa PREVIEW_2023, o compartilhamento de dados tem recurso para operações de gravação e recursos de compartilhamento mais detalhados. Para obter mais informações sobre como configurá-los, consulte Compartilhamento de dados de leitura e gravação em uma Conta da AWS ou em várias contas (visualização). Para obter informações sobre regiões onde os recursos de visualização prévia estão disponíveis, consulte Regiões em que o compartilhamento de dados está disponível.