AWS Glue DataBrew - AWS Präskriptive Leitlinien

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

AWS Glue DataBrew

AWS Glue DataBrew ist ein vollständig verwalteter Service zur visuellen Datenvorbereitung zur Bereinigung, Normalisierung und Transformation von Daten. Er unterscheidet sich von AWS Glue ETL dadurch, dass Sie keinen Code schreiben müssen, um damit zu arbeiten. DataBrew bietet mehr als 250 integrierte Transformationen mit einer visuellen point-and-click Oberfläche für die Erstellung und Verwaltung von Datentransformationsaufträgen.

DataBrew ist in einer separaten Konsolenansicht von AWS Glue verfügbar. Es ist nativ in mehrere AWS Dienste integriert und unterstützt viele verschiedene Dateiformate. Weitere Informationen finden Sie unter Produkt- und Serviceintegrationen.

DataBrew basiert auf den folgenden sechs Kernkonzepten:

  • Projekt — Der gesamte Arbeitsbereich zur Datenaufbereitung in DataBrew

  • Datensatz — Eine Sammlung strukturierter oder halbstrukturierter Daten

  • Rezept — Eine Reihe von Schritten zur Datentransformation; jeder Schritt kann viele Aktionen beinhalten

  • Job — Eine Reihe von Anweisungen zum Ausführen eines Rezepts- oder Datenprofiljobs 

  • Datenherkunft — Die Verfolgung von Daten in einer visuellen Oberfläche, um ihren Ursprung zu identifizieren

  • Datenprofil — Eine zusammenfassende Ansicht der Form Ihrer Daten

AWS Glue DataBrew ist in integriert AWS Glue Studio, sodass Sie DataBrew Rezepte innerhalb Ihrer AWS Glue ETL-Jobs und Workflows orchestrieren können. DataBrew Rezepte können auch AWS Glue Funktionen wie Job-Lesezeichen, automatische Wiederholungsversuche und automatische Skalierung nutzen. Verwenden Sie zunächst DataBrew das Tutorial zum AWS Glue DataBrew Beispielprojekt.