Starten von visuellen ETL Jobs in AWS Glue Studio - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Starten von visuellen ETL Jobs in AWS Glue Studio

Sie können die einfache visuelle Oberfläche verwendenAWS Glue Studio, um Ihre ETL Jobs zu erstellen. Verwenden Sie die Seite Jobs (Aufträge), um neue Aufträge zu erstellen. Sie können auch einen Skripteditor oder ein Notizbuch verwenden, um direkt mit dem Code im AWS Glue Studio ETL Jobskript zu arbeiten.

Auf der Seite Jobs (Aufträge) sehen Sie alle Aufträge, die Sie entweder mit AWS Glue Studio oder AWS Glue erstellt haben. Auf dieser Seite können Sie Ihre Aufträge ansehen, verwalten und ausführen.

Sehen Sie sich auch das Blog-Tutorial an an einem anderen Beispiel, wie man ETL Arbeitsplätze mit schafftAWS Glue Studio.

Starten von Aufträgen in AWS Glue Studio

AWS Glue ermöglicht es Ihnen, einen Auftrag über eine visuelle Oberfläche, ein interaktives Code-Notebook oder mit einem Skript-Editor zu erstellen. Sie können einen Auftrag starten, indem Sie auf eine der Optionen klicken, oder einen neuen Auftrag basierend auf einem Musterauftrag erstellen.

Beispielaufträge erstellen eine Auftrag mit dem Tool Ihrer Wahl. Beispieljobs ermöglichen es Ihnen beispielsweise, einen visuellen ETL Job zu erstellen, der CSV Dateien zu einer Katalogtabelle zusammenfügt, einen Job in einem interaktiven Code-Notizbuch mit AWS Glue für Ray oder AWS Glue für Spark zu erstellen, wenn Sie mit Pandas arbeiten, oder einen Job in einem interaktiven Code-Notizbuch mit Spark zu erstellen. SQL

Einen Job von Grund auf neu erstellen AWS Glue Studio

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die AWS Glue Studio Konsole unter https://console.aws.amazon.com/gluestudio/.

  2. Wählen Sie im Navigationsbereich ETLJobs aus.

  3. Wählen Sie im Bereich Auftrag erstellen eine Konfigurationsoption für Ihren Auftrag aus.

    Der Screenshot zeigt die Seite „Jobs“ (Aufträge) von AWS Glue Studio. Im Bereich „Auftrag erstellen“ werden die Optionen zum Erstellen eines Auftrags angezeigt. Wählen Sie im Abschnitt „Beispielauftrag“ eine Option aus und wählen Sie dann Beispielauftrag erstellen, um einen Beispielauftrag zu starten.

    Optionen zum Erstellen eines Auftrags von Grund auf:

    • Visuell ETL — Autor in einer visuellen Oberfläche, die sich auf den Datenfluss konzentriert

    • Verfassen mithilfe eines interaktiven Code-Notebooks – Verfassen Sie Aufträge interaktiv in einer Benutzeroberfläche, die auf Jupyter Notebooks basiert

      Wenn Sie diese Option auswählen, müssen Sie zusätzliche Informationen bereitstellen, bevor Sie eine Sitzung zur Erstellung eines Notebooks erstellen. Weitere Informationen zum Angeben dieser Informationen finden Sie unter Erste Schritte mit Notebooks in AWS Glue Studio.

    • Code mit einem Skripteditor verfassen — Wenn Sie mit dem Programmieren und Schreiben von ETL Skripten vertraut sind, wählen Sie diese Option, um einen neuen ETL Spark-Job zu erstellen. Wählen Sie die Engine (Python-Shell, Ray, Spark (Python) oder Spark (Scala). Wählen Sie dann Neu starten oder Skript hochladen. Hochladen eines vorhandenen Skripts aus einer lokalen Datei. Wenn Sie den Skripteditor verwenden, können Sie den visuellen Auftragseditor zum Designen oder Bearbeiten Ihres Auftrags nicht verwenden.

      Ein Spark-Auftrag wird in einer von verwalteten Apache-Spark-Umgebung ausgeführt AWS Glue. Standardmäßig werden neue Skripte in Python geschrieben. Informationen zum Schreiben eines neuen Scala-Skripts finden Sie unter Erstellen und Bearbeiten von Scala-Skripten in AWS Glue Studio.

Einen Job AWS Glue Studio aus einem Beispieljob erstellen

Sie können einen Auftrag anhand eines Beispielauftrags auswählen. Wählen Sie im Bereich Beispielaufträge einen Beispielauftrag und wählen Sie dann Beispielauftrag erstellen aus. Die Erstellung eines Beispielauftrags aus einer der Optionen stellt eine schnelle Vorlage bereit, mit der Sie arbeiten können.

  1. Melden Sie sich bei der an AWS Management Console und öffnen Sie die AWS Glue Studio Konsole unter https://console.aws.amazon.com/gluestudio/.

  2. Wählen Sie im Navigationsbereich ETLJobs aus.

  3. Wählen Sie eine Option zum Erstellen eines Auftrags aus einem Beispielauftrag:

    • Visueller ETL Job zum Zusammenführen mehrerer Quellen — Lesen Sie drei CSV Dateien, kombinieren Sie die Daten, ändern Sie die Datentypen, schreiben Sie die Daten dann in Amazon S3 und katalogisieren Sie sie für spätere Abfragen.

    • Spark-Notebook mit Pandas – Erkunden und visualisieren Sie Daten mit dem beliebten Pandas-Framework in Kombination mit Spark.

    • Spark-Notizbuch verwenden SQL — Verwenden Sie diese OptionSQL, um schnell mit Apache Spark zu beginnen. Greifen Sie über den AWS Glue Data Catalog auf Daten zu und transformieren Sie diese mithilfe vertrauter Befehle.

  4. Wählen Sie Beispielauftrag erstellen aus.