Redshift Spectrum et AWS Lake Formation - Amazon Redshift

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Redshift Spectrum et AWS Lake Formation

Cette rubrique explique comment utiliser Redshift Spectrum avec Lake Formation. Lake Formation est un service de partage de données analytiques.

Vous pouvez l'utiliser AWS Lake Formation pour définir et appliquer de manière centralisée des politiques d'accès au niveau des bases de données, des tables et des colonnes aux données stockées dans Amazon S3. Une fois que vos données sont enregistrées sur un AWS Glue Data Catalog activé avec Lake Formation, vous pouvez les interroger en utilisant plusieurs services, dont Redshift Spectrum.

Lake Formation fournit la sécurité et la gouvernance du catalogue de données. Dans Lake Formation, vous pouvez accorder et révoquer des autorisations pour les objets du catalogue de données, tels que les bases de données, les tables, les colonnes et le stockage Amazon S3 sous-jacent.

Important

Vous ne pouvez utiliser Redshift Spectrum avec un catalogue de données compatible avec Lake Formation que dans AWS les régions où Lake Formation est disponible. Pour obtenir la liste des régions disponibles, consultez Points de terminaison et quotas AWS Lake Formation dans le Références générales AWS.

En utilisant Redshift Spectrum avec Lake Formation, vous pouvez effectuer les opérations suivantes :

  • Utilisez Lake Formation en tant qu’emplacement centralisé dans lequel vous accordez et révoquez des autorisations et des politiques de contrôle d’accès sur toutes vos données du lac de données. Lake Formation fournit une hiérarchie d’autorisations pour contrôler l’accès aux bases de données et aux tables dans un catalogue de données. Pour plus d’informations, consultez Octroi d’autorisations Lake Formation du Guide du développeur AWS Lake Formation .

  • Créer des tables externes et interroger les données du lac de données. Avant que les utilisateurs de votre compte puissent exécuter des requêtes, un administrateur de compte de lac de données enregistre vos chemins Amazon S3 existants contenant des données source avec Lake Formation. L’administrateur crée des tables et accorde des autorisations à vos utilisateurs. Des accès peuvent être donnés sur des bases de données, des tables ou des colonnes. L’administrateur peut utiliser des filtres de données dans Lake Formation pour accorder un contrôle d’accès précis à vos données sensibles stockées dans Amazon S3. Pour de plus amples informations, veuillez consulter Utilisation de filtres de données pour la sécurité au niveau de la ligne et au niveau de la cellule.

    Une fois que les données sont enregistrées dans le catalogue de données, à chaque fois que les utilisateurs tentent d’exécuter des interrogations, Lake Formation vérifie l’accès à la table pour ce principal spécifique. Lake Formation attribue des informations d’identification temporaires à Redshift Spectrum et la requête s’exécute.

  • Exécutez des requêtes Redshift Spectrum sur un appareil monté automatiquement à AWS Glue Data Catalog l'aide des informations d'identification IAM obtenues avec GetCredentials ou, et GetClusterCredentials gérez les autorisations de Lake Formation par utilisateur de base de données (IAMR:UserName ou IAM:UserName).

Lorsque vous utilisez Redshift Spectrum avec un catalogue de données activé pour Lake Formation, l’un des éléments suivants doit être en place :

Important

Vous ne pouvez pas lier les rôles IAM lorsque vous utilisez Redshift Spectrum avec un catalogue de données Lake Formation.

Pour en savoir plus sur les étapes nécessaires à la configuration AWS Lake Formation en vue de l'utilisation de Redshift Spectrum, voir Tutoriel : Création d'un lac de données à partir d'une source JDBC dans Lake Formation du guide du développeur.AWS Lake Formation Plus précisément, consultez Interroger les données du lac de données à l’aide d’Amazon Redshift Spectrum pour obtenir des détails sur l’intégration avec Redshift Spectrum. Les données et AWS les ressources utilisées dans cette rubrique dépendent des étapes précédentes du didacticiel.

Utilisation de filtres de données pour la sécurité au niveau de la ligne et au niveau de la cellule

Vous pouvez définir des filtres de données AWS Lake Formation pour contrôler l'accès au niveau des lignes et des cellules de vos requêtes Redshift Spectrum aux données définies dans votre catalogue de données. Pour les configurer, vous effectuez les tâches suivantes :

  • Créez un filtre de données dans Lake Formation avec les informations suivantes :

    • Spécification de colonne avec une liste de colonnes à inclure ou à exclure des résultats de la requête.

    • Expression de filtre de ligne qui spécifie les lignes à inclure dans les résultats de la requête.

    Pour plus d’informations sur la création d’un filtre de données, consultez Filtres de données dans Lake Formation dans le Manuel du développeur AWS Lake Formation .

  • Créez une table externe dans Amazon Redshift qui fait référence à une table de votre catalogue de données compatible avec Lake Formation. Pour plus de détails sur la façon d’interroger une table de Lake Formation à l’aide de Redshift Spectrum, consultez Interroger les données du lac de données à l’aide d’Amazon Redshift Spectrum dans le Manuel du développeur AWS Lake Formation .

Une fois la table définie dans Amazon Redshift, vous pouvez interroger la table Lake Formation et accéder uniquement aux lignes et aux colonnes autorisées par le filtre de données.

Pour un guide détaillé sur la façon de configurer la sécurité au niveau des lignes et des cellules dans Lake Formation, puis d’effectuer des requêtes à l’aide de Redshift Spectrum, consultez Utiliser Amazon Redshift Spectrum avec des stratégies de sécurité au niveau des lignes et des cellules définies dans AWS Lake Formation.