Remplissage du catalogue de AWS Glue données

Vous pouvez remplir le fichier à l' AWS Glue Data Catalog aide des méthodes suivantes :

AWS Glue crawler — An AWS Glue crawler peut automatiquement découvrir et cataloguer des sources de données telles que des bases de données, des lacs de données et des données de streaming. Les robots d'exploration constituent la méthode la plus courante et la plus recommandée pour remplir le catalogue de données, car ils peuvent automatiquement découvrir et déduire les métadonnées d'une grande variété de sources de données.
Ajout manuel de métadonnées : vous pouvez définir manuellement les bases de données, les tables et les détails de connexion et les ajouter au catalogue de données à l'aide de la AWS Glue console, de la console Lake Formation ou AWS Glue des API. AWS CLI La saisie manuelle est utile lorsque vous souhaitez cataloguer des sources de données qui ne peuvent pas être explorées.
Intégration à d'autres AWS services : vous pouvez remplir le catalogue de données avec des métadonnées provenant de services tels qu'Amazon AWS Lake Formation Athena. Ces services peuvent découvrir et enregistrer des sources de données dans le catalogue de données.
Remplissage à partir d'un référentiel de métadonnées existant : si vous disposez d'un magasin de métadonnées existant tel qu'Apache Hive Metastore, vous pouvez l'utiliser AWS Glue pour importer ces métadonnées dans le catalogue de données. Pour plus d'informations, consultez la section Migration entre le métastore Hive et le on. AWS Glue Data Catalog GitHub

Rubriques

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Découverte et catalogage des données

À l'aide d'un AWS Glue crawler