Herstellen einer Verbindung zu Daten - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Herstellen einer Verbindung zu Daten

Eine AWS Glue Verbindung ist ein Datenkatalogobjekt, das Anmeldeinformationen, URI Zeichenfolgen, Virtual Private Cloud (VPC) -Informationen und mehr für einen bestimmten Datenspeicher speichert. AWS Glue Crawler, Jobs und Entwicklungsendpunkte verwenden Verbindungen, um auf bestimmte Arten von Datenspeichern zuzugreifen. Sie können Verbindungen sowohl für Quellen als auch für Ziele verwenden und dieselbe Verbindung für mehrere Crawler- oder Extrahierungs-, Transformations- und Load () ETL -Jobs wiederverwenden.

Übersicht zur Verwendung von Connectors und Verbindungen

Eine Verbindung enthält die Eigenschaften, die für das Verbinden mit einem bestimmten Datenspeicher erforderlich sind. Wenn Sie eine Verbindung erstellen, wird sie im AWS Glue Data Catalog gespeichert. Sie wählen einen Connector aus und erstellen dann eine Verbindung basierend auf diesem Connector.

Sie können Konnektoren für Datenspeicher abonnieren, die nicht nativ unterstützt werden AWS Marketplace, und diese Konnektoren dann verwenden, wenn Sie Verbindungen herstellen. Entwickler können auch eigene Connectors erstellen und sie beim Erstellen von Verbindungen verwenden.

Anmerkung

Verbindungen, die mit benutzerdefinierten Verbindungen oder AWS Marketplace Konnektoren in erstellt wurden, AWS Glue Studio werden in der AWS Glue Konsole mit dem Typ auf angezeigt. UNKNOWN

In den folgenden Schritten wird der allgemeine Prozess zur Verwendung von Connectors in AWS Glue Studio beschrieben:

  1. Abonnieren Sie einen Connector in AWS Marketplace, oder entwickeln Sie Ihren eigenen Connector und laden Sie ihn auf hochAWS Glue Studio. Weitere Informationen finden Sie unter Hinzufügen von Connectors zu AWS Glue Studio.

  2. Überprüfen Sie die Nutzungsinformationen des Connectors. Sie finden diese Informationen auf der Registerkarte Usage (Verwendung) auf der Produktseite des Connectors. Wenn Sie beispielsweise auf dieser Produktseite, AWS GlueConnector für Google, auf den Tab Nutzung klicken BigQuery, finden Sie im Abschnitt Zusätzliche Ressourcen einen Link zu einem Blog über die Verwendung dieses Connectors. Andere Connectors können Links zu den Anweisungen in Bereich Overview (Übersicht) enthalten, wie auf der Connector-Produktseite zum Cloudwatch-Logs-Connector für AWS Glue dargestellt.

  3. Verbindung erstellen Sie wählen aus, welcher Connector verwendet werden soll, und geben zusätzliche Informationen für die Verbindung an, z. B. Anmeldeinformationen, URI Zeichenfolgen und Informationen zur virtuellen privaten Cloud (VPC). Weitere Informationen finden Sie unter Erstellen von Verbindungen für Connectors.

  4. Erstellen Sie eine IAM Rolle für Ihren Job. Der Job setzt die Berechtigungen der IAM Rolle voraus, die Sie bei der Erstellung angeben. Diese IAM Rolle muss über die erforderlichen Berechtigungen verfügen, um sich bei Ihren Datenspeichern zu authentifizieren, Daten aus ihnen zu extrahieren und Daten in diese zu schreiben.

  5. Erstellen Sie einen ETL Job und konfigurieren Sie die Datenquelleneigenschaften für Ihren ETL Job. Geben Sie die Verbindungsoptionen und Authentifizierungsinformationen an, wie vom benutzerdefinierten Connector-Anbieter angewiesen. Weitere Informationen finden Sie unter Erstellen von Aufträgen mit benutzerdefinierten Connectors.

  6. Passen Sie Ihren ETL Job an, indem Sie Transformationen oder zusätzliche Datenspeicher hinzufügen, wie unter beschriebenStarten von visuellen ETL Jobs in AWS Glue Studio.

  7. Wenn Sie einen Konnektor für das Datenziel verwenden, konfigurieren Sie die Eigenschaften des Datenziels für Ihren ETL Job. Geben Sie die Verbindungsoptionen und Authentifizierungsinformationen an, wie vom benutzerdefinierten Connector-Anbieter angewiesen. Weitere Informationen finden Sie unter Erstellen von Aufträgen mit benutzerdefinierten Connectors.

  8. Passen Sie die Umgebung der Auftragsausführung an, indem Sie Auftragseigenschaften konfigurieren, wie unter Ändern der Auftragseigenschaften beschrieben.

  9. Führen Sie den Auftrag aus.