

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Erstellen und betreiben Sie eine DataZone Amazon-Datenquelle für AWS Glue Data Catalog
<a name="create-glue-data-source"></a>

In Amazon können Sie eine AWS Glue Data Catalog Datenquelle erstellen DataZone, aus der Sie technische Metadaten von Datenbanktabellen importieren können AWS Glue. Um eine Datenquelle für hinzuzufügen AWS Glue Data Catalog, muss die Quelldatenbank bereits in vorhanden sein AWS Glue. 

Wenn Sie eine AWS Glue Datenquelle erstellen und ausführen, fügen Sie dem Inventar Ihres DataZone Amazon-Projekts Assets aus der AWS Glue Quelldatenbank hinzu. Sie können Ihre AWS Glue Datenquellen nach einem festgelegten Zeitplan oder bei Bedarf ausführen, um die technischen Metadaten Ihrer Assets zu erstellen oder zu aktualisieren. Während der Datenquellenläufe können Sie sich optional dafür entscheiden, Ihre Assets im DataZone Amazon-Katalog zu veröffentlichen und sie so für alle Domain-Benutzer auffindbar zu machen. Sie können die Ressourcen Ihres Projektinventars auch veröffentlichen, nachdem Sie deren Geschäftsmetadaten bearbeitet haben. Domain-Benutzer können nach Ihren veröffentlichten Ressourcen suchen und diese entdecken und Abonnements für diese Ressourcen beantragen. 

**Um eine AWS Glue Datenquelle hinzuzufügen**

1. Navigieren Sie zur URL des DataZone Amazon-Datenportals und melden Sie sich mit Single Sign-On (SSO) oder Ihren AWS Anmeldeinformationen an. Wenn Sie ein DataZone Amazon-Administrator sind, können Sie unter [https://console.aws.amazon.com/datazone](https://console.aws.amazon.com/datazone) zur DataZone Amazon-Konsole navigieren und sich dort anmelden, AWS-Konto wo die Domain erstellt wurde, und dann Datenportal **öffnen** wählen.

1. **Wählen Sie im oberen Navigationsbereich die Option Projekt** auswählen und wählen Sie das Projekt aus, zu dem Sie die Datenquelle hinzufügen möchten.

1. Navigieren Sie zur Registerkarte **Daten** für das Projekt.

1. Wählen Sie im linken Navigationsbereich **Datenquellen** und dann **Datenquelle erstellen** aus.

1. Konfigurieren Sie die folgenden Felder:
   + **Name** — Der Name der Datenquelle.
   + **Beschreibung** — Die Beschreibung der Datenquelle.

1. Wählen Sie unter **Datenquellentyp** die Option **AWS Glue**.

1. Geben **Sie unter Umgebung auswählen eine** Umgebung an, in der die AWS Glue Tabellen veröffentlicht werden sollen.

1. Geben Sie unter **Datenauswahl** eine AWS Glue Datenbank an und geben Sie Ihre Tabellenauswahlkriterien ein. Wenn Sie beispielsweise **Include** und Enter wählen`*corporate`, enthält die Datenbank alle Quelltabellen, die mit dem Wort enden`corporate`.

   Sie können entweder eine AWS Glue Datenbank aus der Dropdownliste auswählen oder einen Datenbanknamen eingeben. Die Dropdownliste umfasst zwei Datenbanken: die Veröffentlichungsdatenbank und die Abonnementdatenbank der Umgebung. Wenn Sie Elemente aus einer Datenbank übernehmen möchten, die nicht von der Umgebung erstellt wurde, müssen Sie den Namen der Datenbank eingeben, anstatt sie aus der Dropdownliste auszuwählen.

   Sie können mehrere Ein- und Ausschlussregeln für Tabellen innerhalb einer einzigen Datenbank hinzufügen. Sie können auch mehrere Datenbanken hinzufügen, indem **Sie auf die Schaltfläche Weitere Datenbank hinzufügen** klicken.

   

1. Unter **Datenqualität** können Sie wählen, ob Sie die **Datenqualität für diese Datenquelle aktivieren** möchten. Wenn Sie dies tun, DataZone importiert Amazon Ihre bestehende AWS Glue-Datenqualitätsausgabe in Ihren DataZone Amazon-Katalog. Standardmäßig DataZone importiert Amazon die letzten vorhandenen 100 Qualitätsberichte ohne Verfallsdatum von AWS Glue.

   Die Datenqualitätskennzahlen in Amazon DataZone helfen Ihnen dabei, die Vollständigkeit und Genauigkeit Ihrer Datenquellen zu verstehen. Amazon DataZone ruft diese Datenqualitätskennzahlen von AWS Glue ab, um zu einem bestimmten Zeitpunkt einen Kontext bereitzustellen, z. B. bei einer Suche nach einem Geschäftsdatenkatalog. Datennutzer können sehen, wie sich die Datenqualitätskennzahlen für ihre abonnierten Ressourcen im Laufe der Zeit ändern. Datenproduzenten können die Datenqualitätswerte von AWS Glue nach einem Zeitplan aufnehmen. Der DataZone Amazon-Geschäftsdatenkatalog kann auch Datenqualitätskennzahlen aus Systemen von Drittanbietern über Datenqualität anzeigen APIs. Weitere Informationen finden Sie unter [Datenqualität bei Amazon DataZone](datazone-data-quality.md). 

1. Wählen Sie **Weiter** aus.

1. Wählen Sie **unter Veröffentlichungseinstellungen** aus, ob Assets im Geschäftsdatenkatalog sofort auffindbar sind. Wenn Sie sie nur zum Inventar hinzufügen, können Sie später Abonnementbedingungen auswählen und sie im Geschäftsdatenkatalog veröffentlichen. 

1. Wählen Sie **unter Automatisierte Generierung von Unternehmensnamen** aus, ob Metadaten für Assets automatisch generiert werden sollen, wenn diese aus der Quelle importiert werden.

1. (Optional) Fügen Sie für **Metadaten-Formulare** Formulare hinzu, um die Metadaten zu definieren, die gesammelt und gespeichert werden, wenn die Assets in Amazon importiert werden DataZone. Weitere Informationen finden Sie unter [Erstellen Sie ein Metadatenformular in Amazon DataZone](create-metadata-form.md).

1. Wählen **Sie unter Einstellung „Ausführen**“ aus, wann die Datenquelle ausgeführt werden soll.
   + Nach **einem Zeitplan ausführen** — Geben Sie Datum und Uhrzeit für die Ausführung der Datenquelle an.
   + Bei **Bedarf ausführen** — Sie können Datenquellenläufe manuell starten.

1. Wählen Sie **Weiter** aus.

1. Überprüfen Sie Ihre Datenquellenkonfiguration und wählen Sie **Erstellen** aus.

**Anmerkung**  
Wenn eine AWS Glue-Datenquelle erstellt wird, DataZone erstellt Amazon die Lake Formation Formation-Leseberechtigungen für die IAM-Rolle der Umgebung, die zur Erstellung der Datenquelle verwendet wird, um auf alle Tabellen in den in der Datenquelle verwendeten AWS Glue-Datenbanken zuzugreifen. Sie können den Status dieser Zuschüsse unter Datenquellen auf der Detailseite Ihrer Umgebung überwachen. Amazon DataZone fügt der AWS Glue-Datenbank die folgenden AWS Tags hinzu, wenn es Zugriff auf die IAM-Rolle der Veröffentlichungsumgebung gewährt: `DataZoneDiscoverable_${domainId}: true`  
In Umgebungen, die vor der aktuellen Version von Amazon erstellt wurden DataZone, können Projektmitglieder in Amazon Athena keine bewilligten Tabellen sehen.