Tutorial: Den AWS Glue Connector für Elasticsearch verwenden - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Tutorial: Den AWS Glue Connector für Elasticsearch verwenden

Elasticsearch ist ein häufig verwendetes Open-Source-Such- und Analysemodul für die Protokollanalyse, Echtzeitüberwachung von Anwendungen, Clickstream-Analyse und ähnliche Anwendungsfälle. Sie können ihn OpenSearch als Datenspeicher für Ihre Extract-, Transform- und Load (ETL) -Jobs verwenden, indem Sie den AWS Glue Connector für Elasticsearch in konfigurieren. AWS Glue Studio Dieser Konnektor kann kostenlos von AWS Marketplace bezogen werden.

Anmerkung

Der AWS Marketplace Elasticsearch Spark Connector ist veraltet. Bitte verwenden Sie stattdessen den AWS Glue -Konnektor für Elasticsearch .

In diesem Tutorial zeigen wir, wie Sie mit einer minimalen Anzahl von Schritten eine Verbindung zu Ihren Amazon OpenSearch Service-Knoten herstellen können.

Voraussetzungen

Für dieses Tutorial benötigen Sie Folgendes:

  • Zugriff auf AWS Glue Studio

  • Zugriff auf einen OpenSearch Cluster in der AWS Cloud

  • (Optional) Zugriff auf AWS Secrets Manager.

Schritt 1: (Optional) Erstellen Sie einen AWS geheimen Schlüssel für Ihre OpenSearch Clusterinformationen

Damit die Anmeldeinformationen für die Verbindung sicher gespeichert sind und Sie sie sicher verwenden können, speichern Sie sie in AWS Secrets Manager. Das Secret, das Sie erstellen, wird später im Tutorial von der Verbindung verwendet. Die Schlüssel-Wert-Paare der Anmeldeinformationen werden als normale Verbindungsoptionen in den AWS Glue Connector für Elasticsearch eingespeist.

Weitere Informationen zur Erstellung von Secrets finden Sie unter Erstellen und Verwalten von Secrets mit AWS Secrets Manager im AWS Secrets Manager -Benutzerhandbuch.

Um ein Geheimnis zu erstellen AWS
  1. Melden Sie sich an der AWS Secrets Manager -Konsole an.

  2. Wählen Sie entweder auf der Service-Einführungsseite oder der Secrets-Listenseite die Option Store a new secret (Neues Secret speichern).

  3. Wählen Sie auf der Seite Store a new secret (Ein neues Secret speichern) die Option Other type of secret (Andere Art von Secret). Bei dieser Option müssen die Struktur und die Details Ihres Secrets angeben.

  4. Fügen Sie ein Schlüssel - und Wertepaar für den OpenSearch Cluster-Benutzernamen hinzu. Beispielsweise:

    es.net.http.auth.user: username

  5. Wählen Sie + Add row (Zeile hinzufügen) aus und geben Sie ein weiteres Schlüssel-Wert-Paar für das Passwort ein. Beispielsweise:

    es.net.http.auth.pass: password

  6. Wählen Sie Weiter.

  7. Geben Sie einen Secret-Namen ein. Zum Beispiel: my-es-secret. Optional können Sie eine Beschreibung eingeben.

    Notieren Sie den Secret-Namen, der später in diesem Tutorial verwendet wird, und wählen Sie Next (Weiter) aus.

  8. Wählen Sie Next (Weiter) aus und danach Store (Speichern), um das Secret zu erstellen.

Nächster Schritt

Schritt 2: Abonnieren des Konnektors

Schritt 2: Abonnieren des Konnektors

Der AWS Glue Connector für Elasticsearch ist kostenlos erhältlich bei. AWS Marketplace

Um den AWS Glue Connector für Elasticsearch zu abonnieren unter AWS Marketplace
  1. Wenn Sie Ihr AWS Konto noch nicht für die Verwendung von License Manager konfiguriert haben, gehen Sie wie folgt vor:

    1. Öffnen Sie die AWS License Manager Konsole unter https://console.aws.amazon.com/license-manager.

    2. Wählen Sie Create customer managed license (Kundenverwaltete Lizenz erstellen) aus.

    3. Wählen Sie im Fenster mit den IAMBerechtigungen (einmalige Einrichtung) die Option Ich erteile AWS License Manager die erforderlichen Berechtigungen und anschließend Berechtigungen gewähren aus.

      Wenn Sie dieses Fenster nicht sehen, haben Sie bereits die erforderlichen Berechtigungen konfiguriert.

  2. Öffnen Sie die AWS Glue Studio-Konsole unter https://console.aws.amazon.com/gluestudio/.

  3. Erweitern Sie in der AWS Glue Studio Konsole das Menüsymbol ( 3 short, horizontal lines in a vertical stack ) und wählen Sie dann im Navigationsbereich Connectors aus.

  4. Wählen Sie auf der Seite Connectors die Option Go to AWS Marketplace (Zu MKT wechseln) aus.

  5. Geben Sie im Bereich AWS Glue Studio Produkte suchen den Text AWS Glue Connector for Elasticsearch in das Suchfeld ein und drücken Sie dann die Eingabetaste. AWS Marketplace

  6. Wählen Sie den Namen des Connectors. AWS Glue -Connector für Elasticsearch aus.

  7. Die Registerkarten auf der Produktseite für den Konnektor enthalten Informationen zum Konnektor. Wenn Sie bereit sind, fortzufahren, wählen Sie Continue to Subscribe (Abonnieren fortsetzen) aus.

  8. Lesen Sie die Nutzungsbedingungen für die Software. Klicken Sie auf Accept Terms(Bedingungen akzeptieren).

  9. Wenn der Abonnementvorgang abgeschlossen ist, wird die Benachrichtigung „Vielen Dank, dass Sie dieses Produkt abonniert haben! Sie können jetzt Ihre Software konfigurieren“ angezeigt. Oberhalb des Banners befindet sich die Schaltfläche Continue to Configuration (Weiter zur Konfiguration). Wählen Sie Continue to Configuration (Weiter zur Konfiguration) aus.

  10. Wählen Sie die Option „Fulfillment“ auf der Seite Configure this software (Diese Software konfigurieren). Sie können entweder zwischen AWS Glue 1.0/2.0 oder 3.0 wählen. AWS Glue Wählen Sie dann Continue to Launch (Weiter zum Start) aus.

Nächster Schritt

Schritt 3: Aktivieren Sie den Connector AWS Glue Studio und stellen Sie eine Verbindung her

Schritt 3: Aktivieren Sie den Connector AWS Glue Studio und stellen Sie eine Verbindung her

Nachdem Sie Weiter zum Start ausgewählt haben, wird die Seite Diese Software starten unter angezeigt AWS Marketplace. Nachdem Sie den Link zur Aktivierung des Connectors verwendet haben AWS Glue Studio, stellen Sie eine Verbindung her.

Um den Connector bereitzustellen und eine Verbindung herzustellen in AWS Glue Studio
  1. Wählen Sie auf der Seite Diese Software starten in der AWS Marketplace Konsole die Option Nutzungsanweisungen und dann den Link im daraufhin angezeigten Fenster aus.

    Ihr Browser wird auf die AWS Glue Studio Konsolenseite Marketplace-Verbindung erstellen umgeleitet.

  2. Geben Sie einen Namen für die Verbindung ein. Zum Beispiel: my-es-connection.

  3. Wählen Sie im Abschnitt Connection access (Verbindungszugriff) bei Connection credential type (Anmeldeinformationstyp für die Verbindung) die Option Benutzername und Passwort aus.

  4. Geben Sie als AWS secret den Namen Ihres Secrets ein. Zum Beispiel: my-es-secret.

  5. Geben Sie im Abschnitt Netzwerkoptionen die VPC Informationen ein, um eine Verbindung zum OpenSearch Cluster herzustellen.

  6. Wählen Sie Create connection and activate connector (Verbindung erstellen und Konnektor aktivieren) aus.

Nächster Schritt

Schritt 4: Konfigurieren Sie eine IAM Rolle für Ihren ETL Job

Schritt 4: Konfigurieren Sie eine IAM Rolle für Ihren ETL Job

Wenn Sie den AWS Glue ETL Job erstellen, geben Sie eine AWS Identity and Access Management (IAM) Rolle an, die der Job verwenden soll. Die Rolle muss Zugriff auf alle vom Job verwendeten Ressourcen gewähren, einschließlich Amazon S3 (für alle Quellen, Ziele, Skripts, Treiberdateien und temporären Verzeichnisse) und auch auf AWS Glue Data Catalog Objekte.

Die übernommene IAM Rolle für den AWS Glue ETL Job muss auch Zugriff auf das Geheimnis haben, das im vorherigen Abschnitt erstellt wurde. Standardmäßig hat die AWS verwaltete Rolle AWSGlueServiceRole keinen Zugriff auf den geheimen Schlüssel. Informationen zum Einrichten der Zugriffssteuerung für Ihre Secrets finden Sie unter Authentifizierung und Zugriffskontrolle für AWS Secrets Manager und Beschränken des Zugriffs auf bestimmte Secrets.

Um eine IAM Rolle für Ihren ETL Job zu konfigurieren
  1. Konfigurieren Sie die in Überprüfen Sie die für ETL Jobs erforderlichen IAM Berechtigungen beschriebenen Berechtigungen.

  2. Konfigurieren Sie die zusätzlichen Berechtigungen, die für die Verwendung von Konnektoren mit erforderlich sind AWS Glue Studio, wie unter beschriebenErforderliche Berechtigungen zur Verwendung von Konnektoren.

Nächster Schritt

Schritt 5: Erstellen Sie einen Job, der die OpenSearch Verbindung verwendet

Schritt 5: Erstellen Sie einen Job, der die OpenSearch Verbindung verwendet

Nachdem Sie eine Rolle für Ihren ETL Job erstellt haben, können Sie einen Job erstellen AWS Glue Studio , der die Verbindung und den Konnektor für Open Spark verwendet ElasticSearch.

Wenn Ihr Job in einer Amazon Virtual Private Cloud (AmazonVPC) ausgeführt wird, stellen Sie sicher, dass diese korrekt konfiguriert VPC ist. Weitere Informationen finden Sie unter Konfigurieren Sie eine VPC für Ihren ETL-Auftrag.

Einen Auftrag erstellen, der den Elasticsearch-Spark-Konnektor verwendet
  1. Wählen Sie AWS Glue Studio unter Connectors aus.

  2. Wählen Sie aus der Liste Your connection (Ihre Verbindung) die soeben erstellte Verbindung und dann Create job (Auftrag erstellen) aus.

  3. Wählen Sie im visuellen Auftragseditor den Datenquellknoten aus. Auf der Registerkarte rechts (Data source properties - Connector (Datenquelleigenschaften – Konnektor)) machen Sie zusätzliche Angaben für den Konnektor.

    1. Wählen Sie Add schema (Schema hinzufügen) und geben Sie das Schema des Datensatzes in der Datenquelle ein. Verbindungen verwenden keine Tabellen, die im Datenkatalog gespeichert sind, was bedeutet, dass AWS Glue Studio der Datenkatalog das Schema der Daten nicht kennt. Sie müssen diese Schemainformationen manuell angeben. Anweisungen zur Verwendung des Schema-Editors finden Sie unter Bearbeiten des Schemas in einem benutzerdefinierten Transformationsknoten.

    2. Klappen Sie Connection options (Verbindungsoptionen) aus.

    3. Wählen Sie die Option Neue hinzufügen und geben Sie die Informationen ein, die für den Konnektor benötigt werden, der nicht in das AWS Geheimnis eingegeben wurde:

      • es.nodes: https://< OpenSearch Domain-Endpunkt>

      • es.port: 443

      • Pfad: Test

      • es.nodes.wan.only.: true

      Eine Erläuterung dieser Verbindungsoptionen finden Sie unter https://www.elastic.co/guide/en/elasticsearch/hadoop/current/configuration.html.

  4. Fügen Sie dem Diagramm einen Zielknoten hinzu.

    Ihr Datenziel kann Amazon S3 sein, es kann aber auch Informationen aus einem AWS Glue Data Catalog oder einen Connector nutzen, um Daten an einem anderen Speicherort zu schreiben. Sie können beispielsweise eine Datenkatalogtabelle verwenden, um in eine Datenbank in Amazon zu schreibenRDS, oder Sie können einen Connector als Datenziel verwenden, um in AWS Glue Datenspeicher zu schreiben, die nicht nativ unterstützt werden.

    Wenn Sie einen Connector für Ihr Datenziel auswählen, müssen Sie eine Verbindung auswählen, die für diesen Connector erstellt wurde. Außerdem müssen Sie, falls der Connectoranbieter das verlangt, Optionen hinzufügen, um dem Connector zusätzliche Informationen bereitzustellen. Wenn Sie eine Verbindung verwenden, die Informationen für ein AWS Geheimnis enthält, müssen Sie den Benutzernamen und das Kennwort für die Authentifizierung nicht in den Verbindungsoptionen angeben.

  5. Fügen Sie optional zusätzliche Datenquellen und einen oder mehrere Transformationsknoten hinzu, wie unter Transformieren Sie Daten mit AWS Glue verwalteten Transformationen beschrieben.

  6. Konfigurieren Sie die Auftragseigenschaften wie unter Ändern der Auftragseigenschaften beschrieben, beginnend mit Schritt 3, und speichern Sie den Auftrag.

Nächster Schritt

Schritt 6: Ausführen des Auftrags

Schritt 6: Ausführen des Auftrags

Nachdem Sie Ihren Job gespeichert haben, können Sie ihn ausführen, um die ETL Operationen auszuführen.

Um den Job auszuführen, den Sie für den AWS Glue Connector for Elasticsearch erstellt haben
  1. Wählen Sie in der AWS Glue Studio Konsole auf der Visual Editor-Seite die Option Ausführen aus.

  2. Um Informationen über die Auftragsausführung zu sehen, wählen Sie die Option Run Details (Details ausführen) im Bestätigungsbanner oder die Registerkarte Runs (Ausführungen) im visuellen Editor.