Registrar sua conexão como um Glue Data Catalog
Após criar sua fonte de dados, você poderá usar o console do Athena para registrar sua conexão como um Glue Data Catalog. Após o registro, você poderá gerenciar seu catálogo de dados federados e habilitar um controle de acesso refinado usando o Lake Formation. Para obter mais informações, consulte Creating a federated catalog.
É possível registrar os seguintes conectores para integração com o AWS Glue a fim de oferecer um controle de acesso refinado.
Redshift
BigQuery
DynamoDB (pré-visualização)
Snowflake (pré-visualização)
MySQL
PostgreSQL
AWS CMDB
-
Timestream
Pré-requisitos
Antes de começar, conclua os pré-requisitos a seguir.
Certifique-se de que você tenha os perfis e as permissões necessários para registrar locais. Para obter mais informações, consulte Requisitos para funções usadas para registrar locais no Guia do desenvolvedor do AWS Lake Formation.
-
Certifique-se de que você tenha os perfis necessários para o Lake Formation. Para obter mais informações, consulte Prerequisites for connecting the Data Catalog to external data sources no Guia do desenvolvedor do AWS Lake Formation.
-
O perfil que você registrar no Glue deverá ter as permissões listadas no exemplo a seguir.
{ "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "s3:ListBucket", "s3:GetObject" ], "Resource": [ "s3://
amzn-s3-demo-bucket
/<Your_Spill_Prefix>
/*", "s3://amzn-s3-demo-bucket
/<Your_Spill_Prefix>
" ] }, { "Sid": "lambdainvoke", "Effect": "Allow", "Action": "lambda:InvokeFunction", "Resource": "<Lambda_function_arn>
" }, { "Sid": "gluepolicy", "Effect": "Allow", "Action": "glue:*", "Resource": [ "arn:aws:glue:<region>
:<account_id>
:connection/<connection_name>
", "arn:aws:glue:<region>
:<account_id>
:catalog" ] } ] } Você é responsável por determinar e gerenciar o acesso adequado aos dados. Com controles de acesso refinados em consultas federadas, é recomendável usar a política gerenciada AmazonAthenaFullAccess. Se quiser usar sua própria política, você deverá garantir que os usuários que executam consultas federadas não tenham acesso aos seguintes recursos.
-
lambda:InvokeFunction
no conector Lambda especificado na conexão do Glue -
Acesso à localização do bucket de derramamento no IAM
-
Acesso à conexão do Glue associada ao seu catálogo federado
-
Perfil do Lake Formation no IAM
-
Registrar sua conexão usando o console
Para registrar sua conexão como um Glue Data Catalog
Abra o console do Athena em https://console.aws.amazon.com/athena/
. -
No painel de navegação, escolha Fontes de dados e catálogos.
-
Na lista Fontes de dados, escolha a fonte de dados que você criou para abrir a página Detalhes da fonte de dados.
-
Escolha Comece a usar o AWS Lake Formation.
nota
Após escolher essa opção, você deverá gerenciar sua função do Lambda por conta própria. O Athena não excluirá sua função do Lambda.
-
Em Nome do catálogo de dados, forneça um nome exclusivo para seu catálogo.
-
Escolha o Perfil do IAM do Lake Formation que concede permissão ao Lake Formation para invocar a função do Lambda. Certifique-se de que seu perfil tenha as permissões deste exemplo.
-
Na caixa de texto, digite confirmar para excluir a fonte de dados do Athena e substituí-la por um registro do catálogo de dados do Glue.
nota
Essa ação excluirá sua fonte de dados do Athena e criará um novo Glue Data Catalog em seu lugar. Após a conclusão desse processo, talvez seja necessário atualizar as consultas que acessam a fonte de dados para fazer referência ao catálogo de dados do Glue recém-criado.
-
Escolha Criar catálogo e acessar o Lake Formation. Isso vai abrir o console do Lake Formation, onde você poderá gerenciar o catálogo e conceder permissões aos usuários em catálogos, bancos de dados e tabelas.