Registrar sua conexão como um Glue Data Catalog - Amazon Athena

Registrar sua conexão como um Glue Data Catalog

Após criar sua fonte de dados, você poderá usar o console do Athena para registrar sua conexão como um Glue Data Catalog. Após o registro, você poderá gerenciar seu catálogo de dados federados e habilitar um controle de acesso refinado usando o Lake Formation. Para obter mais informações, consulte Creating a federated catalog.

É possível registrar os seguintes conectores para integração com o AWS Glue a fim de oferecer um controle de acesso refinado.

  • Redshift

  • BigQuery

  • DynamoDB (pré-visualização)

  • Snowflake (pré-visualização)

  • MySQL

  • PostgreSQL

  • AWS CMDB

  • Timestream

Pré-requisitos

Antes de começar, conclua os pré-requisitos a seguir.

  • Certifique-se de que você tenha os perfis e as permissões necessários para registrar locais. Para obter mais informações, consulte Requisitos para funções usadas para registrar locais no Guia do desenvolvedor do AWS Lake Formation.

  • Certifique-se de que você tenha os perfis necessários para o Lake Formation. Para obter mais informações, consulte Prerequisites for connecting the Data Catalog to external data sources no Guia do desenvolvedor do AWS Lake Formation.

  • O perfil que você registrar no Glue deverá ter as permissões listadas no exemplo a seguir.

    { "Version": "2012-10-17", "Statement": [{ "Effect": "Allow", "Action": [ "s3:ListBucket", "s3:GetObject" ], "Resource": [ "s3://amzn-s3-demo-bucket/<Your_Spill_Prefix>/*", "s3://amzn-s3-demo-bucket/<Your_Spill_Prefix>" ] }, { "Sid": "lambdainvoke", "Effect": "Allow", "Action": "lambda:InvokeFunction", "Resource": "<Lambda_function_arn>" }, { "Sid": "gluepolicy", "Effect": "Allow", "Action": "glue:*", "Resource": [ "arn:aws:glue:<region>:<account_id>:connection/<connection_name>", "arn:aws:glue:<region>:<account_id>:catalog" ] } ] }
  • Você é responsável por determinar e gerenciar o acesso adequado aos dados. Com controles de acesso refinados em consultas federadas, é recomendável usar a política gerenciada AmazonAthenaFullAccess. Se quiser usar sua própria política, você deverá garantir que os usuários que executam consultas federadas não tenham acesso aos seguintes recursos.

    • lambda:InvokeFunction no conector Lambda especificado na conexão do Glue

    • Acesso à localização do bucket de derramamento no IAM

    • Acesso à conexão do Glue associada ao seu catálogo federado

    • Perfil do Lake Formation no IAM

Registrar sua conexão usando o console

Para registrar sua conexão como um Glue Data Catalog
  1. Abra o console do Athena em https://console.aws.amazon.com/athena/.

  2. No painel de navegação, escolha Fontes de dados e catálogos.

  3. Na lista Fontes de dados, escolha a fonte de dados que você criou para abrir a página Detalhes da fonte de dados.

  4. Escolha Comece a usar o AWS Lake Formation.

    nota

    Após escolher essa opção, você deverá gerenciar sua função do Lambda por conta própria. O Athena não excluirá sua função do Lambda.

  5. Em Nome do catálogo de dados, forneça um nome exclusivo para seu catálogo.

  6. Escolha o Perfil do IAM do Lake Formation que concede permissão ao Lake Formation para invocar a função do Lambda. Certifique-se de que seu perfil tenha as permissões deste exemplo.

  7. Na caixa de texto, digite confirmar para excluir a fonte de dados do Athena e substituí-la por um registro do catálogo de dados do Glue.

    nota

    Essa ação excluirá sua fonte de dados do Athena e criará um novo Glue Data Catalog em seu lugar. Após a conclusão desse processo, talvez seja necessário atualizar as consultas que acessam a fonte de dados para fazer referência ao catálogo de dados do Glue recém-criado.

  8. Escolha Criar catálogo e acessar o Lake Formation. Isso vai abrir o console do Lake Formation, onde você poderá gerenciar o catálogo e conceder permissões aos usuários em catálogos, bancos de dados e tabelas.