Erste Schritte mit Serverless ETL auf AWS Glue - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Erste Schritte mit Serverless ETL auf AWS Glue

Dheer Toprani und Adnan Alvee, Amazon Web Services (AWS)

März 2024 (Dokumentverlauf)

In der Amazon Web Services (AWS) Cloud AWS Glue ist eine vollständig verwaltete Serverless-Umgebung, in der Sie (ETL)-Daten in großem Umfang extrahieren, transformieren und laden können. Mit können AWS Glue Sie Daten kategorisieren, bereinigen, anreichern und zuverlässig über verschiedene Datenspeicher und Streams hinweg auf kostengünstige Weise verschieben.

AWS Glue ist Serverless, sodass Sie sich keine Gedanken über die Bereitstellung oder Verwaltung von Servern machen müssen. Mit zahlen Sie nur für die Ressourcen AWS Glue, die Sie nutzen, und Sie können bei Bedarf hoch- oder herunterskalieren.

AWS Glue besteht aus den folgenden Komponenten:

  • AWS Glue ETL – AWS Glue ETL bietet Batch- und Streaming-Optionen zum Extrahieren, Transformieren und Laden von Daten aus einer Quelle in eine andere.

  • AWS Glue Data Catalog – Data Catalog ist ein zentrales Repository zum Organisieren der Metadaten all Ihrer Datenkomponenten. Data Catalog bietet eine einheitliche Oberfläche, über die Sie Datenkomponenten suchen, entdecken und über -Datenanalyseservices hinweg freigeben können.

  • AWS Glue DataBrew – DataBrew ist ein Tool zur Datenvorbereitung ohne Code, mit dem Sie Daten visuell untersuchen, bereinigen und transformieren können. Sie können aus mehr als 250 vorgefertigten Transformationen wählen, um Datenvorbereitungsaufgaben zu automatisieren, ohne Code schreiben zu müssen.

Dieses Handbuch bietet eine allgemeine Einführung in AWS Glue, einschließlich der Funktionsweise und der ersten Schritte mit . Es behandelt die wichtigsten Konzepte, die Sie kennen müssen, bevor Sie AWS Glue Aufträge erstellen, z. B. Automatisierung, Überwachung und Integration in andere - AWS Services. Der Abschnitt Nächste Schritte macht Sie auf dem Laufenden über das Schreiben von Code in AWS Glue. Wenn Sie bereits Erfahrung mit haben AWS Glue, hilft Ihnen der Abschnitt Bewährte Methoden dabei, etwaige Lücken in Ihrem Wissen zu schließen. Am Ende dieses Handbuchs werden Sie mit dem Wissen und den Ressourcen ausgestattet sein, die Sie benötigen, um effektiv mit der Nutzung AWS Glue zu beginnen.