Como os links de recursos funcionam no Lake Formation - AWS Lake Formation

Como os links de recursos funcionam no Lake Formation

Um link de recurso é um objeto do catálogo de dados que é um link para um banco de dados, ou uma tabela local, ou compartilhada. Depois de criar um link de recurso para um banco de dados ou tabela, você pode usar o nome do link de recurso onde quer que use o nome do banco de dados ou da tabela. Juntamente com as tabelas que você possui ou que são compartilhadas com você, os links de recursos de tabela são retornados pelo glue:GetTables() e aparecem como entradas na página Tabelas do console do Lake Formation. Os links de recursos para bancos de dados agem de maneira semelhante.

A criação de um link de recurso para um banco de dados ou tabela permite que você:

  • Atribua um nome diferente a um banco de dados ou tabela em seu catálogo de dados. Isso é especialmente útil se contas da AWS diferentes compartilharem bancos de dados ou tabelas com o mesmo nome, ou se vários bancos de dados em sua conta tiverem tabelas com o mesmo nome.

  • Acesse os bancos de dados e tabelas do catálogo de dados de qualquer região da AWS, criando links de recursos nessas regiões apontando para o banco de dados e tabelas em outra região. Você pode executar consultas em qualquer região com esses links de recursos usando o Athena, o Amazon EMR e executar trabalhos do AWS Glue no ETL Spark, sem copiar os dados de origem nem os metadados no catálogo de dados do Glue.

  • Use os serviços integrados da AWS, como o Amazon Athena e o Amazon Redshift Spectrum, para executar consultas que acessam bancos de dados ou tabelas compartilhados. Alguns serviços integrados não podem acessar diretamente bancos de dados ou tabelas entre contas. No entanto, eles podem acessar links de recursos em sua conta para bancos de dados e tabelas em outras contas.

nota

Você não precisa criar um link de recurso para referenciar um banco de dados ou tabela compartilhados em scripts de extração, transformação e carregamento (ETL) do AWS Glue. No entanto, para evitar ambiguidades quando várias contas da AWS compartilham um banco de dados ou tabela com o mesmo nome, você pode criar e usar um link de recurso ou especificar a ID do catálogo ao invocar operações de ETL.

O exemplo a seguir mostra a página Tabelas do console Lake Formation, que lista dois links de recursos. Os nomes dos links de recursos são sempre exibidos em itálico. Cada link de recurso é exibido junto com o nome e o proprietário do recurso compartilhado vinculado. Neste exemplo, um administrador de data lake na conta da AWS 1111-2222-3333 compartilhou as tabelas inventory e incidents com a conta 1234-5678-9012. Em seguida, um usuário dessa conta criou links de recursos para essas tabelas compartilhadas.

A página Tabelas mostra dois links de recursos. O nome do link do recurso é mostrado na coluna Nome, o nome da tabela compartilhada é mostrado na coluna Recurso compartilhado e a conta que compartilhou a tabela é mostrada na coluna Proprietário do recurso compartilhado.

A seguir estão notas e restrições sobre links de recursos:

  • Os links de recursos são necessários para permitir que serviços integrados, como Athena e Redshift Spectrum, consultem os dados subjacentes das tabelas compartilhadas. As consultas nesses serviços integrados são construídas com base nos nomes dos links de recursos.

  • Supondo que a configuração Usar somente o controle de acesso do IAM para novas tabelas nesse banco de dados esteja desativada para o banco de dados que o contém, somente a entidade principal que criou um link de recurso pode visualizá-lo e acessá-lo. Para permitir que outras entidades principais da sua conta acessem um link de recurso, conceda a permissão DESCRIBE nela. Para permitir que outras pessoas descartem um link de recurso, conceda a permissão DROP para ele. Os administradores do data lake podem acessar todos os links de recursos na conta. Para descartar um link de recurso criado por outra entidade principal, o administrador do data lake deve primeiro conceder a si a permissão DROP no link do recurso. Para ter mais informações, consulte Referência de permissões do Lake Formation.

    Importante

    Conceder permissões em um link de recurso não concede permissões no banco de dados ou tabela de destino (vinculado). Você deve conceder permissões no destino separadamente.

  • Para criar um link de recurso, você precisa da permissão CREATE_TABLE ou CREATE_DATABASE do Lake Formation, e da permissão glue:CreateTable ou glue:CreateDatabase do AWS Identity and Access Management (IAM).

  • Você pode criar links de recursos para recursos locais (próprios) do catálogo de dados, bem como para recursos compartilhados com sua conta da AWS.

  • Quando você cria um link de recurso, nenhuma verificação é executada para ver se o recurso compartilhado de destino existe ou se você tem permissões entre contas no recurso. Isso permite que você crie o link do recurso e o recurso compartilhado em qualquer ordem.

  • Se você excluir um link de recurso, o recurso compartilhado vinculado não será descartado. Se você descartar um recurso compartilhado, os links de recursos para esse recurso não serão excluídos.

  • É possível criar cadeias de links de recursos. No entanto, não há vantagem em fazer isso, pois as APIs seguem apenas o primeiro link de recurso.