Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Remplissage du catalogue de AWS Glue données
Vous pouvez remplir le fichier à l' AWS Glue Data Catalog aide des méthodes suivantes :
-
AWS Glue crawler — An AWS Glue crawler peut automatiquement découvrir et cataloguer des sources de données telles que des bases de données, des lacs de données et des données de streaming. Les robots d'exploration constituent la méthode la plus courante et la plus recommandée pour remplir le catalogue de données, car ils peuvent automatiquement découvrir et déduire les métadonnées d'une grande variété de sources de données.
-
Ajout manuel de métadonnées : vous pouvez définir manuellement les bases de données, les tables et les détails de connexion et les ajouter au catalogue de données à l'aide de la AWS Glue console, de la console Lake Formation ou AWS Glue des API. AWS CLI La saisie manuelle est utile lorsque vous souhaitez cataloguer des sources de données qui ne peuvent pas être explorées.
-
Intégration à d'autres AWS services : vous pouvez remplir le catalogue de données avec des métadonnées provenant de services tels qu'Amazon AWS Lake Formation Athena. Ces services peuvent découvrir et enregistrer des sources de données dans le catalogue de données.
-
Remplissage à partir d'un référentiel de métadonnées existant : si vous disposez d'un magasin de métadonnées existant tel qu'Apache Hive Metastore, vous pouvez l'utiliser AWS Glue pour importer ces métadonnées dans le catalogue de données. Pour plus d'informations, consultez la section Migration entre le métastore Hive et
le on. AWS Glue Data Catalog GitHub