Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Utilisation des AWS Glue Data Catalog vues dans AWS Glue

Mode de mise au point
Utilisation des AWS Glue Data Catalog vues dans AWS Glue - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Vous pouvez créer et gérer des vues dans le AWS Glue Data Catalog, communément appelé AWS Glue Data Catalog vues. Ces vues sont utiles car elles prennent en charge plusieurs moteurs de requêtes SQL, ce qui vous permet d'accéder à la même vue sur différents AWS services Amazon Athena, tels que Amazon Redshift, et AWS Glue. Vous pouvez utiliser des vues basées sur Apache Iceberg, Apache Hudi et Delta Lake.

En créant une vue dans le catalogue de données, vous pouvez utiliser des autorisations de ressources et des contrôles d'accès basés sur des balises AWS Lake Formation pour autoriser l'accès à celui-ci. Avec cette méthode de contrôle d'accès, il n'est pas nécessaire de configurer un accès supplémentaire aux tables référencées lors de la création de la vue. Cette méthode d'octroi d'autorisations est appelée sémantique du définisseur, et ces vues sont appelées vues du définisseur. Pour plus d'informations sur le contrôle d'accès dans AWS Lake Formation, consultez la section Octroi et révocation d'autorisations sur les ressources du catalogue de données dans le guide du AWS Lake Formation développeur.

Les vues du catalogue de données sont utiles dans les cas d'utilisation suivants :

  • Contrôle d'accès granulaire : vous pouvez créer une vue qui restreint l'accès aux données en fonction des autorisations dont l'utilisateur a besoin. Par exemple, vous pouvez utiliser les vues du catalogue de données pour empêcher les employés qui ne travaillent pas dans le service des ressources humaines de voir les informations personnelles identifiables (PII).

  • Définition complète de la vue : en appliquant des filtres à votre vue dans le catalogue de données, vous vous assurez que les enregistrements de données disponibles dans la vue sont toujours complets.

  • Sécurité renforcée — La définition de requête utilisée pour créer la vue doit être complète, afin que les vues du catalogue de données soient moins vulnérables aux commandes SQL provenant d'acteurs malveillants.

  • Partage de données simplifié : partagez des données avec d'autres AWS comptes sans déplacer de données, grâce au partage de données entre comptes. AWS Lake Formation

Création d’un affichage du Catalogue de données

Vous pouvez créer des vues de catalogue de données à l'aide des scripts AWS Glue ETL AWS CLI et de Spark SQL. La syntaxe permettant de créer une vue du catalogue de données consiste à spécifier le type de vue as MULTI DIALECT et le SECURITY prédicat asDEFINER, en indiquant une vue plus précise.

Exemple d'instruction SQL pour créer une vue du catalogue de données :

CREATE PROTECTED MULTI DIALECT VIEW database_name.catalog_view SECURITY DEFINER AS SELECT order_date, sum(totalprice) AS price FROM source_table GROUP BY order_date;

Après avoir créé une vue du catalogue de données, vous pouvez utiliser un rôle IAM doté de l'autorisation AWS Lake Formation « SELECT » sur la vue pour l'interroger à partir de services tels que des tâches ETL ou des tâches Amazon Athena Amazon Redshift ETL. AWS Glue Il n'est pas nécessaire d'autoriser l'accès aux tables sous-jacentes référencées dans la vue.

Pour plus d'informations sur la création et la configuration des vues du catalogue de données, voir Création de vues du catalogue de AWS Glue données dans le guide du AWS Lake Formation développeur.

Opérations d'affichage prises en charge

Les fragments de commande suivants vous montrent différentes manières d'utiliser les vues du catalogue de données :

CRÉER UNE VUE

Crée une vue du catalogue de données. Voici un exemple illustrant la création d'une vue à partir d'une table existante :

CREATE PROTECTED MULTI DIALECT VIEW catalog_view SECURITY DEFINER AS SELECT * FROM my_catalog.my_database.source_table

MODIFIER LA VUE

Syntaxe disponible :

ALTER VIEW view_name [FORCE] ADD DIALECT AS query ALTER VIEW view_name [FORCE] UPDATE DIALECT AS query ALTER VIEW view_name DROP DIALECT

Vous pouvez utiliser FORCE ADD DIALECT cette option pour forcer la mise à jour du schéma et des sous-objets conformément au nouveau dialecte du moteur. Notez que cela peut entraîner des erreurs de requête si vous ne les utilisez pas également FORCE pour mettre à jour d'autres dialectes du moteur. Voici un exemple :

ALTER VIEW catalog_view FORCE ADD DIALECTAS SELECT order_date, sum(totalprice) AS priceFROM source_tableGROUP BY orderdate;

Ce qui suit montre comment modifier une vue afin de mettre à jour le dialecte :

ALTER VIEW catalog_view UPDATE DIALECT AS SELECT count(*) FROM my_catalog.my_database.source_table;

DÉCRIRE LA VUE

Syntaxe disponible pour décrire une vue :

SHOW COLUMNS {FROM|IN} view_name [{FROM|IN} database_name]— Si l'utilisateur dispose AWS Glue des AWS Lake Formation autorisations requises pour décrire la vue, il peut répertorier les colonnes. Voici quelques exemples de commandes permettant d'afficher des colonnes :

SHOW COLUMNS FROM my_database.source_table; SHOW COLUMNS IN my_database.source_table;

DESCRIBE view_name— Si l'utilisateur dispose AWS Glue des AWS Lake Formation autorisations requises pour décrire la vue, il peut répertorier les colonnes de la vue ainsi que ses métadonnées.

SUPPRIMER LA VUE

Syntaxe disponible :

DROP VIEW [ IF EXISTS ] view_name

L'exemple suivant montre une DROP instruction qui teste si une vue existe avant de la supprimer :

DROP VIEW IF EXISTS catalog_view;

SHOW CREATE VIEW view_name— Affiche l'instruction SQL qui crée la vue spécifiée. Voici un exemple illustrant la création d'une vue de catalogue de données :

SHOW CREATE TABLE my_database.catalog_view;CREATE PROTECTED MULTI DIALECT VIEW my_catalog.my_database.catalog_view ( net_profit, customer_id, item_id, sold_date) TBLPROPERTIES ( 'transient_lastDdlTime' = '1736267222') SECURITY DEFINER AS SELECT * FROM my_database.store_sales_partitioned_lf WHERE customer_id IN (SELECT customer_id from source_table limit 10)

AFFICHER LES VUES

Répertoriez toutes les vues du catalogue, telles que les vues normales, les vues multidialectes (MDV) et les vues MDV sans le dialecte Spark. La syntaxe disponible est la suivante :

SHOW VIEWS [{ FROM | IN } database_name] [LIKE regex_pattern]:

Voici un exemple de commande permettant d'afficher les vues :

SHOW VIEWS IN marketing_analytics LIKE 'catalog_view*';

Pour plus d'informations sur la création et la configuration de vues de catalogue de données, voir Création de vues de catalogue de AWS Glue données dans le guide du AWS Lake Formation développeur.

Interrogation d’un affichage du Catalogue de données

Après avoir créé une vue du catalogue de données, vous pouvez interroger la vue. Le rôle IAM configuré dans vos AWS Glue tâches doit disposer de l'autorisation Lake Formation SELECT dans la vue du catalogue de données. Il n'est pas nécessaire d'autoriser l'accès aux tables sous-jacentes référencées dans la vue.

Une fois que tout est configuré, vous pouvez demander votre avis. Par exemple, vous pouvez exécuter la requête suivante pour accéder à une vue.

SELECT * from my_database.catalog_view LIMIT 10;

Limites

Tenez compte des limites suivantes lorsque vous utilisez les vues du catalogue de données.

  • Vous ne pouvez créer des vues de catalogue de données qu'avec la AWS Glue version 5.0 et les versions ultérieures.

  • Le définisseur de vues du catalogue de données doit avoir SELECT accès aux tables de base sous-jacentes auxquelles la vue accède. La création de la vue du catalogue de données échoue si des filtres Lake Formation sont imposés au rôle de définisseur d'une table de base spécifique.

  • Les tables de base ne doivent pas être autorisées à entrer dans le lac de IAMAllowedPrincipals données AWS Lake Formation. Le cas échéant, l'erreur Multi Dialect views ne peut référencer que des tables sans les autorisations IAMAllowed Principaux se produit.

  • L'emplacement Amazon S3 de la table doit être enregistré en tant qu'emplacement de lac de AWS Lake Formation données. Si la table n'est pas enregistrée, l'erreur Multi Dialect views may only reference AWS Lake Formation managed tables se produit. Pour plus d'informations sur la façon d'enregistrer des sites Amazon S3 dans AWS Lake Formation, consultez la section Enregistrement d'un site Amazon S3 dans le guide du AWS Lake Formation développeur.

  • Vous pouvez uniquement créer des vues PROTECTED de catalogue de données. UNPROTECTEDles vues ne sont pas prises en charge.

  • Vous ne pouvez pas référencer les tables d'un autre AWS compte dans une définition de vue du catalogue de données. Vous ne pouvez pas non plus référencer une table dans le même compte situé dans une région distincte.

  • Pour partager des données entre un compte ou une région, la vue complète doit être partagée entre comptes et entre régions, à l'aide de liens vers des AWS Lake Formation ressources.

  • Les fonctions définies par l'utilisateur (UDFs) ne sont pas prises en charge.

  • Vous ne pouvez pas référencer d'autres vues dans les vues du catalogue de données.

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.