AWS Data Pipeline ist für Neukunden nicht mehr verfügbar. Bestehende Kunden von AWS Data Pipeline können den Service weiterhin wie gewohnt nutzen. Weitere Informationen
Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Datenknoten
Bei diesem Beispiel werden ein Eingabedatenknoten, ein Ausgabedatenknoten und eine Datenbank verwendet.
Eingabedatenknoten
Die S3DataNode
Eingabe-Pipeline-Komponente definiert den Speicherort der Eingabedaten in Amazon S3 und das Datenformat der Eingabedaten. Weitere Informationen finden Sie unter S3 DataNode.
Diese Eingabekomponente wird durch folgende Felder definiert:
{ "id": "S3DataNodeId1", "schedule": { "ref": "ScheduleId1" }, "filePath": "s3://datapipeline-us-east-1/samples/hive-ads-samples.csv", "name": "DefaultS3DataNode1", "dataFormat": { "ref": "CSVId1" }, "type": "S3DataNode" },
id
-
Die benutzerdefinierte ID, die nur als Referenz dient.
schedule
-
Einen Verweis auf die Zeitplankomponente.
filePath
-
Den Pfad zu den Daten, die mit dem Datenknoten verknüpft sind, der in diesem Beispiel eine CSV-Eingabedatei ist.
name
-
Den benutzerdefinierten Namen, der nur als Referenz dient.
dataFormat
-
Einen Verweis auf das Format der Daten für die Aktivitätsverarbeitung.
Ausgabedatenknoten
Die RedshiftDataNode
Output-Pipeline-Komponente definiert einen Speicherort für die Ausgabedaten, in diesem Fall eine Tabelle in einer Amazon Redshift-Datenbank. Weitere Informationen finden Sie unter RedshiftDataNode. Diese Ausgabekomponente wird durch folgende Felder definiert:
{ "id": "RedshiftDataNodeId1", "schedule": { "ref": "ScheduleId1" }, "tableName": "orders", "name": "DefaultRedshiftDataNode1", "createTableSql": "create table StructuredLogs (requestBeginTime CHAR(30) PRIMARY KEY DISTKEY SORTKEY, requestEndTime CHAR(30), hostname CHAR(100), requestDate varchar(20));", "type": "RedshiftDataNode", "database": { "ref": "RedshiftDatabaseId1" } },
id
-
Die benutzerdefinierte ID, die nur als Referenz dient.
schedule
-
Einen Verweis auf die Zeitplankomponente.
tableName
-
Der Name der Amazon Redshift-Tabelle.
name
-
Den benutzerdefinierten Namen, der nur als Referenz dient.
createTableSql
-
Einen SQL-Ausdruck, der die Tabelle in der Datenbank erstellt.
database
-
Ein Verweis auf die Amazon Redshift-Datenbank.
Datenbank
Die RedshiftDatabase
-Komponente wird durch folgende Felder definiert: Weitere Informationen finden Sie unter RedshiftDatabase.
{ "id": "RedshiftDatabaseId1", "databaseName": "
dbname
", "username": "user
", "name": "DefaultRedshiftDatabase1", "*password": "password
", "type": "RedshiftDatabase", "clusterId": "redshiftclusterId" },
id
-
Die benutzerdefinierte ID, die nur als Referenz dient.
databaseName
-
Den Namen der logischen Datenbank.
username
-
Den Benutzernamen für die Verbindung zur Datenbank.
name
-
Den benutzerdefinierten Namen, der nur als Referenz dient.
password
-
Das Passwort für die Verbindung zur Datenbank.
clusterId
-
Die ID des Redshift-Clusters.