Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
AWS Glue Data Catalog Il s'agit d'un référentiel de métadonnées central qui stocke les métadonnées structurelles et opérationnelles de vos ensembles de données Amazon S3. La gestion efficace du catalogue de données est essentielle au maintien de la qualité, des performances, de la sécurité et de la gouvernance des données.
En comprenant et en appliquant ces pratiques de gestion du catalogue de données, vous pouvez vous assurer que vos métadonnées restent précises, performantes, sécurisées et bien gouvernées au fur et à mesure de l'évolution de votre environnement de données.
Cette section couvre les aspects suivants de la gestion du catalogue de données :
Mise à jour du schéma de table et des partitions Au fur et à mesure de l'évolution de vos données, vous devrez peut-être mettre à jour le schéma de table ou la structure de partition définis dans le catalogue de données. Pour plus d'informations sur la façon d'effectuer ces mises à jour par programmation à l'aide de l' AWS Glue ETL, consultez. Mise à jour du schéma et ajout de nouvelles partitions dans le catalogue de données à l'aide de AWS Glue tâches ETL
Gestion des statistiques sur les colonnes : des statistiques précises sur les colonnes permettent d'optimiser les plans de requêtes et d'améliorer les performances. Pour plus d'informations sur la façon de générer, de mettre à jour et de gérer les statistiques des colonnes, consultezOptimisation des performances des requêtes à l'aide des statistiques des colonnes.
Chiffrement du catalogue de données Pour protéger les métadonnées sensibles, vous pouvez chiffrer votre catalogue de données à l'aide de AWS Key Management Service ()AWS KMS. Cette section explique comment activer et gérer le chiffrement de votre catalogue de données.
La sécurisation du catalogue de données avec AWS Lake Formation Lake Formation fournit une approche globale de la sécurité des lacs de données et du contrôle d'accès. Vous pouvez utiliser Lake Formation pour sécuriser et régir l'accès à votre catalogue de données et aux données sous-jacentes.