Automatisches Generieren einer API für ETL-Skripts - AWS Glue

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Automatisches Generieren einer API für ETL-Skripts

Die API für die Generierung von ETL-Skripts beschreibt die Datentypen und die API zur Generierung von ETL-Skripts in AWS Glue.

Datentypen

CodeGenNode-Struktur

Repräsentiert einen Knoten in einem azyklisch gerichteten Diagramm (DAG)

Felder
  • IdErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Identifier string pattern.

    Eine Knotenkennung, die innerhalb des Knotendiagramms einzigartig ist.

  • NodeTypeErforderlich: UTF-8-Zeichenfolge.

    Der Typ des Knotens, der hier vorliegt.

  • ArgsErforderlich: Ein Array mit CodeGenNodeArg-Objekten, nicht mehr als 50 Strukturen.

    Eigenschaften des Knotens in Form von Name-Wert-Paaren.

  • LineNumber – Zahl (Ganzzahl).

    Die Zeilennummer des Knotens.

CodeGenNodeArg-Struktur

Ein Argument oder eine Eigenschaft eines Knotens.

Felder
  • NameErforderlich: UTF-8-Zeichenfolge.

    Der Name des Arguments oder der Eigenschaft.

  • ValueErforderlich: UTF-8-Zeichenfolge.

    Der Wert des Arguments oder der Eigenschaft.

  • Param – Boolesch.

    True, wenn der Wert als Parameter verwendet wird.

CodeGenEdge-Struktur

Repräsentiert einen Richtungs-Edge in einem azyklisch gerichteten Diagramm (DAG).

Felder
  • SourceErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Identifier string pattern.

    Die ID des Knotens, an dem der Edge beginnt.

  • TargetErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Identifier string pattern.

    Die ID des Knotens, an dem der Edge endet.

  • TargetParameter – UTF-8-Zeichenfolge.

    Das Ziel des Edge.

Speicherortstruktur

Der Speicherort von Ressourcen.

Felder
  • Jdbc – Ein Array mit CodeGenNodeArg-Objekten, nicht mehr als 50 Strukturen.

    Ein JDBC-Speicherort.

  • S3 – Ein Array mit CodeGenNodeArg-Objekten, nicht mehr als 50 Strukturen.

    Amazon Simple Storage Service (Amazon S3)-Speicherort.

  • DynamoDB – Ein Array mit CodeGenNodeArg-Objekten, nicht mehr als 50 Strukturen.

    Ein Amazon DynamoDB-Tabellenspeicherort.

CatalogEntry-Struktur

Gibt eine Tabellendefinition im AWS Glue Data Catalog an.

Felder
  • DatabaseNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Die Datenbank, in der die Tabellenmetadaten gespeichert sind.

  • TableNameErforderlich: UTF-8-Zeichenfolge, nicht weniger als 1 oder mehr als 255 Bytes lang, passend zum Single-line string pattern.

    Der Name der betreffenden Tabelle.

MappingEntry-Struktur

Definiert ein Mapping.

Felder
  • SourceTable – UTF-8-Zeichenfolge.

    Der Name der Quelltabelle.

  • SourcePath – UTF-8-Zeichenfolge.

    Der -Quellpfad

  • SourceType – UTF-8-Zeichenfolge.

    Der Quelltyp.

  • TargetTable – UTF-8-Zeichenfolge.

    Die Zieltabelle.

  • TargetPath – UTF-8-Zeichenfolge.

    Der Zielpfad.

  • TargetType – UTF-8-Zeichenfolge.

    Der Zieltyp.

Operationen

Aktion CreateScript (Python: create_script)

Wandelt ein azyklisch gerichtetes Diagramm (DAG) in Code um.

Anfrage
  • DagNodes – Ein Array mit CodeGenNode-Objekten.

    Eine Liste der Knoten im DAG.

  • DagEdges – Ein Array mit CodeGenEdge-Objekten.

    Eine Liste der Edges im DAG.

  • Language – UTF-8-Zeichenfolge (zulässige Werte: PYTHON | SCALA).

    Die Programmiersprache des resultierenden Codes aus dem DAG.

Antwort
  • PythonScript – UTF-8-Zeichenfolge.

    Das aus dem DAG generierte Python-Skript.

  • ScalaCode – UTF-8-Zeichenfolge.

    Der aus dem DAG generierte Scala-Code.

Fehler
  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

Aktion GetDataflowGraph (Python: get_dataflow_graph)

Wandelt ein Python-Skript in ein azyklisch gerichtetes Diagramm (DAG) um.

Anfrage
  • PythonScript – UTF-8-Zeichenfolge.

    Das umzuwandelnde Python-Skript.

Antwort
  • DagNodes – Ein Array mit CodeGenNode-Objekten.

    Eine Liste der Knoten im resultierenden DAG.

  • DagEdges – Ein Array mit CodeGenEdge-Objekten.

    Eine Liste der Edges im resultierenden DAG.

Fehler
  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

Aktion GetMapping (Python: get_mapping)

Erstellt Mappings.

Anfrage
  • SourceErforderlich: Ein CatalogEntry-Objekt.

    Gibt die Quelltabelle an.

  • Sinks – Ein Array mit CatalogEntry-Objekten.

    Eine Liste der Zieltabellen.

  • Location – Ein Ort-Objekt.

    Parameter für das Mapping.

Antwort
  • MappingErforderlich: Ein Array mit MappingEntry-Objekten.

    Eine Liste der Mappings zu den angegebenen Zielen.

Fehler
  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException

  • EntityNotFoundException

Aktion GetPlan (Python: get_plan)

Ruft Code zum Ausführen eines angegebenen Mappings ab.

Anfrage
  • MappingErforderlich: Ein Array mit MappingEntry-Objekten.

    Die Liste der Mappings aus einer Quelltabelle zu Zieltabellen.

  • SourceErforderlich: Ein CatalogEntry-Objekt.

    Die Quelltabelle.

  • Sinks – Ein Array mit CatalogEntry-Objekten.

    Die Zieltabellen.

  • Location – Ein Ort-Objekt.

    Die Parameter für das Mapping.

  • Language – UTF-8-Zeichenfolge (zulässige Werte: PYTHON | SCALA).

    Die Programmiersprache des Codes zum Ausführen des Mappings.

  • AdditionalPlanOptionsMap – Ein Map-Array von Schlüssel-Wert-Paaren.

    Jeder Schlüssel ist eine UTF-8-Zeichenfolge.

    Jeder Wert ist eine UTF-8-Zeichenfolge.

    Eine Map, die zusätzliche optionale Schlüssel-Wert-Parameter enthält.

    Derzeit werden diese Schlüssel-Wert-Paare unterstützt:

    • inferSchema – Legt fest, ob inferSchema für das von einem AWS Glue-Auftrag generierte Standardskript auf „true“ oder „false“ gesetzt wird. Legen Sie beispielsweise inferSchema auf „true“ fest, um das folgende Schlüssel-Wert-Paar zu übergeben:

      --additional-plan-options-map '{"inferSchema":"true"}'

Antwort
  • PythonScript – UTF-8-Zeichenfolge.

    Ein Python-Skript zum Ausführen des Mappings.

  • ScalaCode – UTF-8-Zeichenfolge.

    Der Scala-Code zum Ausführen des Mappings.

Fehler
  • InvalidInputException

  • InternalServiceException

  • OperationTimeoutException