RedshiftDataNode

Define un nodo de datos utilizando Amazon Redshift. RedshiftDataNode representa las propiedades de los datos de una base de datos como, por ejemplo, una tabla de datos, que utiliza la canalización.

Ejemplo

A continuación se muestra un ejemplo de este tipo de objeto.


{
  "id" : "MyRedshiftDataNode",
  "type" : "RedshiftDataNode",
  "database": { "ref": "MyRedshiftDatabase" },
  "tableName": "adEvents",
  "schedule": { "ref": "Hour" }
}

Sintaxis

Campos obligatorios	Description (Descripción)	Tipo de slot
database	La base de datos en la que se encuentra la tabla.	Objeto de referencia, por ejemplo, «database»: {"ref»:» myRedshiftDatabase Id "}
tableName	Nombre de la tabla de Amazon Redshift. La tabla se crea si aún no existe y tú la has proporcionado createTableSql.	Cadena

Campos de invocación de objetos	Description (Descripción)	Tipo de slot
horario	Este objeto se invoca dentro de la ejecución de un intervalo de programación. Los usuarios deben especificar una referencia de programación a otro objeto para establecer el orden de ejecución de dependencia para este objeto. Los usuarios pueden cumplir este requisito estableciendo explícitamente una programación en el objeto, por ejemplo, especificando «schedule»: {"ref»: "DefaultSchedule«}. En la mayoría de los casos, es mejor poner la referencia de programación en el objeto de la canalización predeterminado de modo que todos los objetos hereden ese programa. O bien, si la canalización tiene un árbol de programas (programas dentro del programa maestro), los usuarios pueden crear un objeto principal que tenga una referencia de programación. Para obtener más información acerca de las configuraciones de programación opcionales de ejemplo, consulte https://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-object-schedule.html	Objeto de referencia, por ejemplo, «schedule»: {"ref»:» myScheduleId «}

Campos opcionales	Description (Descripción)	Tipo de slot
attemptStatus	Estado más reciente notificado por la actividad remota.	Cadena
attemptTimeout	Tiempo de espera para que se complete el trabajo remoto. Si se establece, se puede reintentar una actividad remota que no se complete dentro del tiempo de inicio establecido.	Periodo
createTableSql	Una expresión SQL para crear la tabla en la base de datos. Se recomienda especificar el esquema en el que se debe crear la tabla, por ejemplo: CREATE TABLE mySchema.myTable (bestColumn varchar (25) primary key distkey, integer sortKey). numberOfWins AWS Data Pipeline ejecuta el script en el createTableSql campo si la tabla, especificada por TableName, no existe en el esquema, especificado por el campo SchemaName. Por ejemplo, si especifica SchemaName como mySchema pero no incluye mySchema en el createTableSql campo, la tabla se crea en el esquema incorrecto (de forma predeterminada, se crearía en PUBLIC). Esto ocurre porque AWS Data Pipeline no analiza sus instrucciones CREATE TABLE.	Cadena
dependsOn	Especificar la dependencia de otro objeto ejecutable.	Objeto de referencia, por ejemplo, «dependSon»: {"ref»:» «} myActivityId
failureAndRerunModo	Describe el comportamiento del nodo del consumidor cuando las dependencias producen un error o se vuelven a ejecutar.	Enumeración
lateAfterTimeout	El tiempo transcurrido desde el inicio de la canalización dentro del cual el objeto debe completarse. Solo se activa cuando el tipo de programación no está establecido en `ondemand`.	Periodo
maxActiveInstances	El número máximo de instancias activas simultáneas de un componente. Las nuevas ejecuciones no cuentan para el número de instancias activas.	Entero
maximumRetries	El número máximo de intentos en caso de error.	Entero
onFail	Acción que se debe ejecutar cuando el objeto actual produzca un error.	Objeto de referencia, por ejemplo, «onFail»: {"ref»:» myActionId «}
onLateAction	Acciones que deben iniciarse si un objeto todavía no se ha programado o no se ha completado.	Objeto de referencia, por ejemplo, "onLateAction«: {" ref»:» myActionId «}
onSuccess	Acción que se debe ejecutar cuando el objeto actual se complete correctamente.	Objeto de referencia, por ejemplo, «onSuccess»: {"ref»:» myActionId «}
parent	Elemento principal del objeto actual del que se heredarán los slots.	Objeto de referencia, por ejemplo, «parent»: {"ref»:» myBaseObject Id "}
pipelineLogUri	El URI de S3 (como 's3://BucketName/Key/ ') para cargar los registros de la canalización.	Cadena
precondition	Opcionalmente, defina una condición previa. Un nodo de datos no se marca como "READY" hasta que se han cumplido todas las condiciones previas.	Objeto de referencia, por ejemplo, «condición previa»: {"ref»:» «} myPreconditionId
primaryKeys	Si no especifica primaryKeys para una tabla de destino en `RedShiftCopyActivity`, puede especificar una lista de columnas utilizando primaryKeys, que actuará como mergeKey. Sin embargo, si dispone de un valor de primaryKey definido en una tabla de Amazon Redshift, este ajuste anulará la clave existente.	Cadena
reportProgressTimeout	Tiempo de espera para llamadas sucesivas del trabajo remoto a reportProgress. Si se establece, las actividades remotas que no informen de su progreso durante el período especificado pueden considerarse estancadas y, en consecuencia, reintentarse.	Periodo
retryDelay	Duración del tiempo de espera entre dos reintentos.	Periodo
runsOn	El recurso informático para ejecutar la actividad o comando. Por ejemplo, una instancia de Amazon EC2 o un clúster de Amazon EMR.	Objeto de referencia, por ejemplo, «RunSon»: {"ref»:» myResourceId «}
scheduleType	El tipo de programa le permite especificar si los objetos de la definición de la canalización deben programarse al principio del intervalo o al final de este. La programación de estilo de serie temporal significa que las instancias se programan al final de cada intervalo y la programación de estilo cron significa que las instancias se programan al principio de cada intervalo. Un programa bajo demanda le permite ejecutar una canalización una vez por activación. Esto significa que no tiene que clonar o recrear la canalización para ejecutarla de nuevo. Si usa un programa bajo demanda, debe especificarse en el objeto predeterminado y debe ser el único scheduleType especificado para los objetos de la canalización. Para usar canalizaciones bajo demanda, basta con llamar a la ActivatePipeline operación para cada ejecución posterior. Los valores son: cron, ondemand y timeseries.	Enumeración
schemaName	Este campo opcional especifica el nombre del esquema para la tabla de Amazon Redshift. Si no se especifica, el nombre del esquema es PUBLIC, que es el esquema predeterminado en Amazon Redshift. Para obtener más información, consulte la Guía de desarrollador de base de datos de Amazon Redshift.	Cadena
workerGroup	El grupo de procesos de trabajo. Este se usa para dirigir tareas. Si proporciona un valor runsOn y workerGroup existe, se hace caso omiso de workerGroup.	Cadena

Campos de tiempo de ejecución	Description (Descripción)	Tipo de slot
@activeInstances	Lista de los objetos de instancias activas programados actualmente.	Objeto de referencia, por ejemplo, «ActiveInstances»: {"ref»:» myRunnableObject Id "}
@actualEndTime	La hora a la que finalizó la ejecución de este objeto.	DateTime
@actualStartTime	La hora a la que comenzó la ejecución de este objeto.	DateTime
cancellationReason	El valor de cancellationReason si este objeto se ha cancelado.	Cadena
@cascadeFailedOn	Descripción de la cadena de dependencia en la que ha fallado el objeto.	Objeto de referencia, por ejemplo, "cascadeFailedOn«: {" ref»:» myRunnableObject Id "}
emrStepLog	Registros de pasos de EMR disponibles únicamente sobre intentos de actividad de EMR.	Cadena
errorId	El valor de errorId si este objeto ha fallado.	Cadena
errorMessage	El valor de errorMessage si este objeto ha fallado.	Cadena
errorStackTrace	El seguimiento de la pila de error si este objeto ha fallado.	Cadena
@finishedTime	La hora a la que este objeto finalizó su ejecución.	DateTime
hadoopJobLog	Los registros de trabajo de Hadoop disponibles sobre intentos de actividades basadas en EMR.	Cadena
@healthStatus	El estado de salud del objeto que refleja el éxito o el fracaso de la última instancia de objeto que alcanzó un estado terminado.	Cadena
@healthStatusFromInstanceId	ID del último objeto de instancia que alcanzó un estado terminado.	Cadena
@ healthStatusUpdated Hora	Hora a la que el estado de salud se actualizó la última vez.	DateTime
hostname	El nombre de host del cliente que recogió el intento de tarea.	Cadena
@lastDeactivatedTime	La hora a la que este objeto se desactivó la última vez.	DateTime
@ latestCompletedRun Hora	Hora de la última ejecución para la que se completó la ejecución.	DateTime
@latestRunTime	Hora de la última ejecución para la que se programó la ejecución.	DateTime
@nextRunTime	Hora de ejecución que se va a programar a continuación.	DateTime
reportProgressTime	La hora más reciente a la que la actividad remota notificó algún progreso.	DateTime
@scheduledEndTime	Hora de finalización programada para el objeto.	DateTime
@scheduledStartTime	Hora de comienzo programada para el objeto.	DateTime
@status	El estado de este objeto.	Cadena
@version	Versión de la canalización con la que se creó el objeto.	Cadena
@waitingOn	Descripción de la lista de dependencias de la que este objeto está a la espera.	Objeto de referencia, por ejemplo, «WaitingOn»: {"ref»:» myRunnableObject Id "}

Campos del sistema	Description (Descripción)	Tipo de slot
@error	Error al describir el objeto mal estructurado.	Cadena
@pipelineId	ID de la canalización a la que pertenece este objeto.	Cadena
@sphere	La esfera de un objeto denota su lugar en el ciclo de vida: los objetos de componente dan lugar a objetos de instancia que ejecutan objetos de intento.	Cadena

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

MySqlDataNode

S3 DataNode