Sélectionner vos préférences de cookies

Nous utilisons des cookies essentiels et des outils similaires qui sont nécessaires au fonctionnement de notre site et à la fourniture de nos services. Nous utilisons des cookies de performance pour collecter des statistiques anonymes afin de comprendre comment les clients utilisent notre site et d’apporter des améliorations. Les cookies essentiels ne peuvent pas être désactivés, mais vous pouvez cliquer sur « Personnaliser » ou « Refuser » pour refuser les cookies de performance.

Si vous êtes d’accord, AWS et les tiers approuvés utiliseront également des cookies pour fournir des fonctionnalités utiles au site, mémoriser vos préférences et afficher du contenu pertinent, y compris des publicités pertinentes. Pour accepter ou refuser tous les cookies non essentiels, cliquez sur « Accepter » ou « Refuser ». Pour effectuer des choix plus détaillés, cliquez sur « Personnaliser ».

Gestion du catalogue de données

Mode de mise au point
Gestion du catalogue de données - AWS Glue

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

AWS Glue Data Catalog Il s'agit d'un référentiel de métadonnées central qui stocke les métadonnées structurelles et opérationnelles de vos ensembles de données Amazon S3. La gestion efficace du catalogue de données est essentielle au maintien de la qualité, des performances, de la sécurité et de la gouvernance des données.

En comprenant et en appliquant ces pratiques de gestion du catalogue de données, vous pouvez vous assurer que vos métadonnées restent précises, performantes, sécurisées et bien gouvernées au fur et à mesure de l'évolution de votre environnement de données.

Cette section couvre les aspects suivants de la gestion du catalogue de données :

  • Mise à jour du schéma de table et des partitions Au fur et à mesure de l'évolution de vos données, vous devrez peut-être mettre à jour le schéma de table ou la structure de partition définis dans le catalogue de données. Pour plus d'informations sur la façon d'effectuer ces mises à jour par programmation à l'aide de l' AWS Glue ETL, consultez. Mise à jour du schéma et ajout de nouvelles partitions dans le catalogue de données à l'aide de AWS Glue tâches ETL

  • Gestion des statistiques sur les colonnes : des statistiques précises sur les colonnes permettent d'optimiser les plans de requêtes et d'améliorer les performances. Pour plus d'informations sur la façon de générer, de mettre à jour et de gérer les statistiques des colonnes, consultezOptimisation des performances des requêtes à l'aide des statistiques des colonnes.

  • Chiffrement du catalogue de données Pour protéger les métadonnées sensibles, vous pouvez chiffrer votre catalogue de données à l'aide de AWS Key Management Service ()AWS KMS. Cette section explique comment activer et gérer le chiffrement de votre catalogue de données.

  • La sécurisation du catalogue de données avec AWS Lake Formation Lake Formation fournit une approche globale de la sécurité des lacs de données et du contrôle d'accès. Vous pouvez utiliser Lake Formation pour sécuriser et régir l'accès à votre catalogue de données et aux données sous-jacentes.

ConfidentialitéConditions d'utilisation du sitePréférences de cookies
© 2025, Amazon Web Services, Inc. ou ses affiliés. Tous droits réservés.