Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Importieren in &S3; AWS Glue Job kapselt ein Skript, das eine Verbindung zu Ihren Quelldaten herstellt, sie verarbeitet und sie dann in Ihr Datenziel schreibt. In der Regel führt ein Auftrag Extraktions-, Transformations- und Ladeskripts (Extract, Transform and Load, ETL) aus. Aufträge können Skripte ausführen, die für Apache Spark und Ray-Laufzeitumgebungen entwickelt wurden. Jobs können auch allgemeine Python-Skripte (Python-Shell-Jobs) ausführen. AWS Glue Trigger können Jobs auf der Grundlage eines Zeitplans oder Ereignisses oder bei Bedarf starten. Sie können Auftragsausführungen überwachen, um mehr über Laufzeitmetriken wie Bearbeitungsstatus, Dauer und Startzeit zu erfahren.
Sie können Skripts verwenden, die AWS Glue generiert oder Sie können Ihre eigenen bereitstellen. Mit einem Quellschema und einer Zielposition oder einem Schema AWS Glue Studio Der Codegenerator kann automatisch ein Apache Spark-API-Skript (PySpark) erstellen. Sie können dieses Skript als Ausgangspunkt verwenden und es bearbeiten, um Ihre Ziele zu erreichen.
AWS Glue kann Ausgabedateien in verschiedenen Datenformaten schreiben. Jeder Auftragstyp unterstützt möglicherweise unterschiedliche Ausgabeformate. Für einige Datenformate können gängige Komprimierungsformate geschrieben werden.
Melden Sie sich an bei AWS Glue Konsole
Ein Job in AWS Glue besteht aus der Geschäftslogik, die ETL-Aufgaben (Extrahieren, Transformieren und Laden) ausführt. Sie können Jobs im ETL-Bereich des AWS Glue console.
Um bestehende Jobs anzusehen, melden Sie sich bei der an AWS Management Console und öffnen Sie die AWS Glue Konsole unter https://console.aws.amazon.com/glue/
Beim Erstellen eines neuen Jobs oder nachdem Sie Ihren Job gespeichert haben, können Sie AWS Glue Studio um Ihre ETL-Jobs zu ändern. Dazu bearbeiten Sie die Knoten im visuellen Editor bzw. das Auftragsskript im Entwicklermodus. Sie können auch Knoten im visuellen Editor hinzufügen und entfernen und komplexere ETL-Aufträge erstellen.
Die nächsten Schritte zum Erstellen eines Jobs in AWS Glue Studio
Sie verwenden den visuellen Auftragseditor, um Knoten für Ihren Auftrag zu konfigurieren. Jeder Knoten stellt eine Aktion dar, z. B. das Lesen von Daten vom Quellspeicherort oder das Anwenden einer Transformation auf die Daten. Jeder Knoten, den Sie Ihrem Auftrag hinzufügen, verfügt über Eigenschaften, die Informationen zum Datenspeicherort oder zur Transformation bereitstellen.
Die nächsten Schritte zum Erstellen und Verwalten Ihrer Jobs sind: