Mode de fonctionnement des liens des ressources dans Lake Formation - AWS Lake Formation

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Mode de fonctionnement des liens des ressources dans Lake Formation

Un lien de ressource est un objet du catalogue de données qui est un lien vers une base de données ou une table locale ou partagée. Après avoir créé un lien de ressource vers une base de données ou une table, vous pouvez utiliser le nom du lien de ressource partout où vous utiliseriez le nom de la base de données ou de la table. Outre les tables dont vous êtes propriétaire ou les tables partagées avec vous, les liens vers les ressources des tables sont renvoyés par la page Tables de la console Lake Formation glue:GetTables() et apparaissent sous forme d'entrées sur celle-ci. Les liens vers les ressources vers les bases de données agissent de la même manière.

La création d'un lien de ressource vers une base de données ou une table vous permet d'effectuer les opérations suivantes :

  • Attribuez un nom différent à une base de données ou à une table dans votre catalogue de données. Cela est particulièrement utile si différents AWS comptes partagent des bases de données ou des tables portant le même nom, ou si plusieurs bases de données de votre compte possèdent des tables portant le même nom.

  • Accédez aux bases de données et aux tables du catalogue de données depuis n'importe quelle AWS région en créant des liens de ressources dans ces régions pointant vers la base de données et les tables d'une autre région. Vous pouvez exécuter des requêtes dans n'importe quelle région avec ces liens de ressources en utilisant Athena, Amazon EMR et exécuter des tâches AWS Glue ETL Spark, sans copier les données source ni les métadonnées dans Glue Data Catalog.

  • Utilisez AWS des services intégrés tels qu' Amazon Athena Amazon Redshift Spectrum pour exécuter des requêtes qui accèdent à des bases de données ou à des tables partagées. Certains services intégrés ne peuvent pas accéder directement aux bases de données ou aux tables d'un compte à l'autre. Ils peuvent toutefois accéder aux liens de ressources de votre compte vers les bases de données et les tables d'autres comptes.

Note

Il n'est pas nécessaire de créer un lien de ressource pour référencer une base de données ou une table partagée dans AWS Glue scripts d'extraction, de transformation et de chargement (ETL). Toutefois, pour éviter toute ambiguïté lorsque plusieurs AWS comptes partagent une base de données ou une table portant le même nom, vous pouvez soit créer et utiliser un lien de ressource, soit spécifier l'ID du catalogue lorsque vous appelez des opérations. ETL

L'exemple suivant montre la page Tables de la console Lake Formation, qui répertorie deux liens vers des ressources. Les noms des liens vers les ressources sont toujours affichés en italique. Chaque lien de ressource est affiché avec le nom et le propriétaire de la ressource partagée associée. Dans cet exemple, un administrateur de lac de données du AWS compte 1111-2222-3333 a partagé les tables inventory et incidents avec le compte 1234-5678-9012. Un utilisateur de ce compte a ensuite créé des liens de ressources vers ces tables partagées.

La page Tables affiche deux liens vers des ressources. Le nom du lien de ressource est affiché sous la colonne Nom, le nom de la table partagée est affiché sous la colonne Ressource partagée et le compte qui a partagé la table est affiché sous la colonne Propriétaire de la ressource partagée.

Les remarques et restrictions relatives aux liens vers les ressources sont les suivantes :

  • Des liens vers des ressources sont nécessaires pour permettre aux services intégrés tels qu'Athena et Redshift Spectrum d'interroger les données sous-jacentes des tables partagées. Les requêtes de ces services intégrés sont construites en fonction des noms des liens vers les ressources.

  • En supposant que le paramètre Utiliser uniquement le contrôle d'IAMaccès pour les nouvelles tables de cette base de données soit désactivé pour la base de données contenante, seul le principal ayant créé un lien de ressource peut le consulter et y accéder. Pour permettre aux autres utilisateurs de votre compte d'accéder à un lien vers une ressource, accordez-leur l'DESCRIBEautorisation correspondante. Pour permettre à d'autres personnes de supprimer un lien vers une ressource, DROP accordez-lui l'autorisation. Les administrateurs du data lake peuvent accéder à tous les liens vers les ressources du compte. Pour supprimer un lien de ressource créé par un autre principal, l'administrateur du lac de données doit d'abord s'accorder l'DROPautorisation sur le lien de ressource. Pour de plus amples informations, veuillez consulter Référence des autorisations de Lake Formation.

    Important

    L'octroi d'autorisations sur un lien de ressource n'accorde pas d'autorisations sur la base de données ou la table cible (liée). Vous devez accorder des autorisations à la cible séparément.

  • Pour créer un lien vers une ressource, vous avez besoin de la Lake Formation CREATE_TABLE ou CREATE_DATABASE de l'autorisation glue:CreateTable ou glue:CreateDatabase AWS Identity and Access Management (IAM).

  • Vous pouvez créer des liens vers des ressources locales (détenues) du catalogue de données, ainsi que vers des ressources partagées avec votre AWS compte.

  • Lorsque vous créez un lien vers une ressource, aucune vérification n'est effectuée pour vérifier si la ressource partagée cible existe ou si vous disposez d'autorisations entre comptes sur la ressource. Cela vous permet de créer le lien vers la ressource et la ressource partagée dans n'importe quel ordre.

  • Si vous supprimez un lien vers une ressource, la ressource partagée associée n'est pas supprimée. Si vous supprimez une ressource partagée, les liens vers cette ressource ne sont pas supprimés.

  • Il est possible de créer des chaînes de liens entre les ressources. Cependant, cela ne sert à rien, car ils ne APIs suivent que le premier lien de ressource.