O Athena pode ler e gravar dados armazenados em clusters do Redshift ou namespaces com tecnologia sem servidor registrados no AWS Glue Data Catalog. Isso funciona em conjunto com o AWS Lake Formation, que fornece segurança e governança centralizadas, garantindo que o acesso aos dados seja gerenciado de modo consistente em diferentes mecanismos de consulta e mantendo controles de acesso refinados para os dados compartilhados do Redshift.
Considerações e limitações
-
Visões materializadas: as visões materializadas do Amazon Redshift podem ser consultadas no Athena, mas não há compatibilidade com a criação de visões materializadas usando o Athena ou o Spark.
-
Não há compatibilidade com as operações de DDL, incluindo a definição da configuração do AWS Glue Data Catalog e as operações nas tabelas de armazenamento gerenciado do Amazon Redshift.
Pré-requisitos
Antes que você possa consultar um catálogo de dados do AWS Glue pelo Athena, conclua as seguintes tarefas:
-
Crie e registre um cluster do Amazon Redshift ou namespace com tecnologia sem servidor no AWS Glue Data Catalog. Para obter mais informações, consulte Registering a cluster to the AWS Glue Data Catalog ou Registering namespaces to the AWS Glue Data Catalog no Guia de gerenciamento do Amazon Redshift.
-
Crie um catálogo de dados do AWS Lake Formation usando o namespace registrado. Para obter mais informações, consulte Creating Amazon Redshift federated catalogs no Guia do desenvolvedor do AWS Lake Formation.
-
(Opcional) Use o Lake Formation para definir controles de acesso refinados no catálogo. Para obter mais informações, consulte Bringing your data into the AWS Glue Data Catalog no Guia do desenvolvedor do AWS Lake Formation.
Registrar um catálogo de dados do Redshift com o console do Athena
Para registrar um catálogo de dados do Redshift no console do Athena, execute as etapas a seguir.
-
Abra o console do Athena em https://console.aws.amazon.com/athena/
. -
No painel de navegação, escolha Fontes de dados e catálogos.
-
Na página Fontes de dados e catálogos, escolha Criar fonte de dados.
-
Em Escolher uma fonte de dados, escolha Amazon S3 - AWS Glue Data Catalog.
-
Na seção AWS Glue Data Catalog, em Conta da fonte de dados, escolha AWS Glue Data Catalog nesta conta.
-
Em Criar uma tabela ou registrar um catálogo, escolha Registrar um novo catálogo do AWS Glue.
-
Na seção Detalhes da fonte de dados, em Nome da fonte de dados, insira o nome que deseja usar para especificar a fonte de dados em suas consultas SQL ou use o nome padrão gerado.
-
Em Catálogo, escolha Procurar para pesquisar uma lista de catálogos do AWS Glue na mesma conta. Se você não encontrar nenhum catálogo existente, crie um no console do AWS Glue
. -
Na caixa de diálogo Procurar catálogos do AWS Glue, selecione o catálogo que deseja usar e selecione Escolher.
-
(Opcional) Em Tags, adicione pares de chave/valor que queira associar à fonte de dados.
-
Escolha Próximo.
-
Na página Revisar e criar, verifique se as informações inseridas estão corretas e selecione Criar fonte de dados.