Nodos de datos

En este ejemplo se usan un nodo de datos de entrada, un nodo de datos de salida y una base de datos.

Nodo de datos de entrada

El componente de canalización S3DataNode de entrada define la ubicación de los datos de entrada en Amazon S3 y el formato de datos de los datos de entrada. Para obtener más información, consulte S3 DataNode.

Este componente de entrada se define por los siguientes campos:


{
  "id": "S3DataNodeId1",
  "schedule": {
    "ref": "ScheduleId1"
  },
  "filePath": "s3://datapipeline-us-east-1/samples/hive-ads-samples.csv",
  "name": "DefaultS3DataNode1",
  "dataFormat": {
    "ref": "CSVId1"
  },
  "type": "S3DataNode"
},

id: El ID definido por el usuario, que es una etiqueta solo con fines de referencia.
schedule: Una referencia al componente de programación.
filePath: La ruta a los datos asociados al nodo de datos, que es un archivo de entrada CSV en este ejemplo.
name: El nombre definido por el usuario, que es una etiqueta solo con fines de referencia.
dataFormat: Una referencia al formato de los datos para la actividad que se procesará.

Nodo de datos de salida

El componente de canalización RedshiftDataNode de salida define una ubicación para los datos de salida; en este caso, una tabla de una base de datos de Amazon Redshift. Para obtener más información, consulte RedshiftDataNode. Este componente de salida se define por los siguientes campos:


{
  "id": "RedshiftDataNodeId1",
  "schedule": {
    "ref": "ScheduleId1"
  },
  "tableName": "orders",
  "name": "DefaultRedshiftDataNode1",
  "createTableSql": "create table StructuredLogs (requestBeginTime CHAR(30) PRIMARY KEY DISTKEY SORTKEY, requestEndTime CHAR(30), hostname CHAR(100), requestDate varchar(20));",
  "type": "RedshiftDataNode",
  "database": {
    "ref": "RedshiftDatabaseId1"
  }
},

id: El ID definido por el usuario, que es una etiqueta solo con fines de referencia.
schedule: Una referencia al componente de programación.
tableName: Nombre de la tabla de Amazon Redshift.
name: El nombre definido por el usuario, que es una etiqueta solo con fines de referencia.
createTableSql: Una expresión SQL para crear la tabla en la base de datos.
database: Una referencia a la base de datos de Amazon Redshift.

Base de datos

El componente RedshiftDatabase se define por los siguientes campos. Para obtener más información, consulte RedshiftDatabase.


{
  "id": "RedshiftDatabaseId1",
  "databaseName": "dbname",
  "username": "user",
  "name": "DefaultRedshiftDatabase1",
  "*password": "password",
  "type": "RedshiftDatabase",
  "clusterId": "redshiftclusterId"
},

id: El ID definido por el usuario, que es una etiqueta solo con fines de referencia.
databaseName: El nombre de la base de datos lógica.
username: El nombre de usuario para conectarse a la base de datos.
name: El nombre definido por el usuario, que es una etiqueta solo con fines de referencia.
password: La contraseña para conectarse a la base de datos.
clusterId: El ID del clúster de Redshift.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Definir una canalización en formato JSON

Recurso