Den AWS Glue Datenkatalog auffüllen - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Den AWS Glue Datenkatalog auffüllen

Sie können den AWS Glue Data Catalog mit den folgenden Methoden auffüllen:

  • AWS-Glue-Crawler — An AWS-Glue-Crawler kann Datenquellen wie Datenbanken, Data Lakes und Streaming-Daten automatisch erkennen und katalogisieren. Die Crawler sind die gängigste und empfohlene Methode zum Füllen des Datenkatalogs, da sie automatisch Metadaten für eine Vielzahl von Datenquellen erkennen und daraus ableiten können.

  • Manuelles Hinzufügen von Metadaten — Sie können Datenbanken, Tabellen und Verbindungsdetails manuell definieren und sie mithilfe der AWS Glue Konsole, der Lake Formation Formation-Konsole oder AWS Glue APIs zum Datenkatalog hinzufügen. AWS CLI Die manuelle Eingabe ist nützlich, wenn Sie Datenquellen katalogisieren möchten, die nicht gecrawlt werden können.

  • Integration mit anderen AWS Diensten — Sie können den Datenkatalog mit Metadaten von Diensten wie Amazon AWS Lake Formation Athena füllen. Diese Dienste können Datenquellen im Datenkatalog erkennen und registrieren.

  • Daten aus einem vorhandenen Metadaten-Repository auffüllen — Wenn Sie bereits über einen Metadatenspeicher wie Apache Hive Metastore verfügen, können AWS Glue Sie diese Metadaten in den Datenkatalog importieren. Weitere Informationen finden Sie unter Migration zwischen dem Hive Metastore und dem Hive Metastore. AWS Glue Data Catalog GitHub