Nœuds de données

L'exemple utilise un nœud de données d'entrée, un nœud de données de sortie et une base de données.

Nœud de données d'entrée

Le composant du S3DataNode pipeline d'entrée définit l'emplacement des données d'entrée dans Amazon S3 et le format des données d'entrée. Pour de plus amples informations, veuillez consulter S3 DataNode.

Le composant d'entrée est défini par les champs suivants :


{
  "id": "S3DataNodeId1",
  "schedule": {
    "ref": "ScheduleId1"
  },
  "filePath": "s3://datapipeline-us-east-1/samples/hive-ads-samples.csv",
  "name": "DefaultS3DataNode1",
  "dataFormat": {
    "ref": "CSVId1"
  },
  "type": "S3DataNode"
},

id: ID défini par l'utilisateur (libellé fourni à titre de référence uniquement).
schedule: Référence au composant planification.
filePath: Chemin d'accès aux données associées au nœud de données (fichier d'entrée CSV dans l'exemple).
name: Nom défini par l'utilisateur (libellé fourni à titre de référence uniquement).
dataFormat: Référence au format des données de l'activité à traiter.

Nœud de données de sortie

Le composant du RedshiftDataNode pipeline de sortie définit un emplacement pour les données de sortie ; dans ce cas, une table dans une base de données Amazon Redshift. Pour de plus amples informations, veuillez consulter RedshiftDataNode. Le composant de sortie est défini par les champs suivants :


{
  "id": "RedshiftDataNodeId1",
  "schedule": {
    "ref": "ScheduleId1"
  },
  "tableName": "orders",
  "name": "DefaultRedshiftDataNode1",
  "createTableSql": "create table StructuredLogs (requestBeginTime CHAR(30) PRIMARY KEY DISTKEY SORTKEY, requestEndTime CHAR(30), hostname CHAR(100), requestDate varchar(20));",
  "type": "RedshiftDataNode",
  "database": {
    "ref": "RedshiftDatabaseId1"
  }
},

id: ID défini par l'utilisateur (libellé fourni à titre de référence uniquement).
schedule: Référence au composant planification.
tableName: Nom de la table Amazon Redshift.
name: Nom défini par l'utilisateur (libellé fourni à titre de référence uniquement).
createTableSql: Expression SQL permettant de créer la table dans la base de données.
database: Une référence à la base de données Amazon Redshift.

Base de données

Le composant RedshiftDatabase est défini par les champs ci-après. Pour de plus amples informations, veuillez consulter RedshiftDatabase.


{
  "id": "RedshiftDatabaseId1",
  "databaseName": "dbname",
  "username": "user",
  "name": "DefaultRedshiftDatabase1",
  "*password": "password",
  "type": "RedshiftDatabase",
  "clusterId": "redshiftclusterId"
},

id: ID défini par l'utilisateur (libellé fourni à titre de référence uniquement).
databaseName: Nom de la base de données logique.
username: Nom d'utilisateur pour la connexion à la base de données.
name: Nom défini par l'utilisateur (libellé fourni à titre de référence uniquement).
password: Mot de passe pour la connexion à la base de données.
clusterId: ID du cluster Redshift.

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Définition d'un pipeline au format JSON

Ressource