Nächste Schritte - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Nächste Schritte

Transformationen verstehen AWS Glue

Für eine effizientere Datenverarbeitung AWS Glue enthält es integrierte Transformationsfunktionen. Die Funktionen werden in einer Datenstruktur namens a, einer Erweiterung von Apache Spark SQL DynamicFrame, von Transformation zu Transformation übergeben DataFrame. A DynamicFrame ist ähnlich wie a DataFrame, außer dass jeder Datensatz sich selbst beschreibt, sodass zunächst kein Schema erforderlich ist.

Um sich mit verschiedenen AWS Glue PySpark integrierten Funktionen vertraut zu machen, lesen Sie den Blogbeitrag Aufbau einer AWS Glue ETL-Pipeline lokal ohne AWS-Konto.

Verfassen Ihres ersten ETL-Jobs

Wenn Sie noch keinen ETL-Job geschrieben haben, können Sie zunächst die Drei AWS Glue ETL-Auftragstypen für die Konvertierung von Daten in das Apache Parquet-Muster verwenden.

Wenn Sie Erfahrung mit dem Schreiben von ETL-Jobs haben, können Sie sich AWS Glue GitHub anhand der Beispiele eingehender damit befassen.

Preisgestaltung

Preisinformationen finden Sie unter AWS Glue Preise. Sie können den auch verwenden AWS Pricing Calculator, um Ihre monatlichen Kosten für die Verwendung verschiedener AWS Glue Komponenten zu schätzen.