Datenknoten - AWS Data Pipeline

AWS Data Pipeline ist für Neukunden nicht mehr verfügbar. Bestehende Kunden von AWS Data Pipeline können den Service weiterhin wie gewohnt nutzen. Weitere Informationen

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Datenknoten

Bei diesem Beispiel werden ein Eingabedatenknoten, ein Ausgabedatenknoten und eine Datenbank verwendet.

Eingabedatenknoten

Die S3DataNode Eingabe-Pipeline-Komponente definiert den Speicherort der Eingabedaten in Amazon S3 und das Datenformat der Eingabedaten. Weitere Informationen finden Sie unter S3 DataNode.

Diese Eingabekomponente wird durch folgende Felder definiert:

{ "id": "S3DataNodeId1", "schedule": { "ref": "ScheduleId1" }, "filePath": "s3://datapipeline-us-east-1/samples/hive-ads-samples.csv", "name": "DefaultS3DataNode1", "dataFormat": { "ref": "CSVId1" }, "type": "S3DataNode" },
id

Die benutzerdefinierte ID, die nur als Referenz dient.

schedule

Einen Verweis auf die Zeitplankomponente.

filePath

Den Pfad zu den Daten, die mit dem Datenknoten verknüpft sind, der in diesem Beispiel eine CSV-Eingabedatei ist.

name

Den benutzerdefinierten Namen, der nur als Referenz dient.

dataFormat

Einen Verweis auf das Format der Daten für die Aktivitätsverarbeitung.

Ausgabedatenknoten

Die RedshiftDataNode Output-Pipeline-Komponente definiert einen Speicherort für die Ausgabedaten, in diesem Fall eine Tabelle in einer Amazon Redshift-Datenbank. Weitere Informationen finden Sie unter RedshiftDataNode. Diese Ausgabekomponente wird durch folgende Felder definiert:

{ "id": "RedshiftDataNodeId1", "schedule": { "ref": "ScheduleId1" }, "tableName": "orders", "name": "DefaultRedshiftDataNode1", "createTableSql": "create table StructuredLogs (requestBeginTime CHAR(30) PRIMARY KEY DISTKEY SORTKEY, requestEndTime CHAR(30), hostname CHAR(100), requestDate varchar(20));", "type": "RedshiftDataNode", "database": { "ref": "RedshiftDatabaseId1" } },
id

Die benutzerdefinierte ID, die nur als Referenz dient.

schedule

Einen Verweis auf die Zeitplankomponente.

tableName

Der Name der Amazon Redshift-Tabelle.

name

Den benutzerdefinierten Namen, der nur als Referenz dient.

createTableSql

Einen SQL-Ausdruck, der die Tabelle in der Datenbank erstellt.

database

Ein Verweis auf die Amazon Redshift-Datenbank.

Datenbank

Die RedshiftDatabase-Komponente wird durch folgende Felder definiert: Weitere Informationen finden Sie unter RedshiftDatabase.

{ "id": "RedshiftDatabaseId1", "databaseName": "dbname", "username": "user", "name": "DefaultRedshiftDatabase1", "*password": "password", "type": "RedshiftDatabase", "clusterId": "redshiftclusterId" },
id

Die benutzerdefinierte ID, die nur als Referenz dient.

databaseName

Den Namen der logischen Datenbank.

username

Den Benutzernamen für die Verbindung zur Datenbank.

name

Den benutzerdefinierten Namen, der nur als Referenz dient.

password

Das Passwort für die Verbindung zur Datenbank.

clusterId

Die ID des Redshift-Clusters.