RedshiftDataNode

Amazon Redshift を使用するデータノードを定義します。RedshiftDataNode は、パイプラインで使用される、データベース内のデータのプロパティ (データテーブルなど) を表します。

例

以下は、このオブジェクト型の例です。


{
  "id" : "MyRedshiftDataNode",
  "type" : "RedshiftDataNode",
  "database": { "ref": "MyRedshiftDatabase" },
  "tableName": "adEvents",
  "schedule": { "ref": "Hour" }
}

構文

必須フィールド	説明	スロットタイプ
database	テーブルが存在するデータベース。	参照オブジェクト ("database":{"ref":"myRedshiftDatabaseId"} など)
tableName	Amazon Redshift テーブルの名前。このテーブルが存在しない場合に createTableSql を指定すると、テーブルが作成されます。	String

オブジェクト呼び出しフィールド	説明	スロットタイプ
スケジュール	このオブジェクトは、スケジュール期間の実行中に呼び出されます。ユーザーは、このオブジェクトの依存関係の実行順序を設定するには、別のオブジェクトへのスケジュール参照を指定する必要があります。ユーザーは、オブジェクトでスケジュールを明示的に設定して、この要件を満たすことができます。たとえば、"schedule": {"ref": "DefaultSchedule"} と指定します。ほとんどの場合、すべてのオブジェクトがそのスケジュールを継承するように、スケジュール参照をデフォルトのパイプラインオブジェクトに配置することをお勧めします。または、パイプラインにスケジュールのツリー (マスタースケジュール内のスケジュール) がある場合、ユーザーは、スケジュール参照がある親オブジェクトを作成することができます。オプションのスケジュール設定の例については、「https://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-object-schedule.html」を参照してください。	参照オブジェクト ("schedule":{"ref":"myScheduleId"} など)

オプションのフィールド	説明	スロットタイプ
attemptStatus	リモートアクティビティから最も最近報告されたステータス。	String
attemptTimeout	リモートの作業完了のタイムアウト。設定された場合、設定された開始時間内に完了しなかったリモートアクティビティを再試行することができます。	期間
createTableSql	データベースにテーブルを作成する SQL 式。テーブルを作成するスキーマを指定することをお勧めします。例えば、CREATE TABLE mySchema.myTable (bestColumn varchar(25) primary key distkey, numberOfWins integer sortKey) です。tableName で指定されたテーブルが schemaName フィールドで指定されたスキーマに存在しない場合は、createTableSql schemaName フィールドでスクリプト AWS Data Pipeline を実行します。たとえば、schemaName として mySchema を指定し、createTableSql フィールドに mySchema を含めない場合、間違ったスキーマにテーブルが作成されます (デフォルトでは PUBLIC に作成されます)。これは、AWS Data Pipeline では CREATE TABLE ステートメントが解析されないためです。	String
dependsOn	実行可能な別のオブジェクトで依存関係を指定します	参照オブジェクト ("dependsOn":{"ref":"myActivityId"} など)
failureAndRerunMode	依存関係が失敗または再実行されたときのコンシューマーノードの動作を示します。	一覧表
lateAfterTimeout	オブジェクトが完了しなければならない、パイプライン開始からの経過時間。スケジュールタイプが `ondemand` に設定されていない場合にのみトリガーされます。	期間
maxActiveInstances	コンポーネントで同時にアクティブになるインスタンスの最大数。再実行はアクティブなインスタンスの数にはカウントされません。	整数
maximumRetries	失敗時の最大再試行回数。	整数
onFail	現在のオブジェクトが失敗したときに実行するアクション。	参照オブジェクト (onFail:{"ref":"myActionId"} など)
onLateAction	オブジェクトが予定されていないか、まだ完了していない場合にトリガーされるアクション。	参照オブジェクト ("onLateAction":{"ref":"myActionId"} など)
onSuccess	現在のオブジェクトが成功したときに実行するアクション。	参照オブジェクト ("onSuccess":{"ref":"myActionId"} など)
parent	スロットの継承元となる現在のオブジェクトの親。	参照オブジェクト ("parent":{"ref":"myBaseObjectId"} など)
pipelineLogUri	パイプラインのログをアップロードするための S3 URI (s3://BucketName/Key/ など)。	String
precondition	オプションで前提条件を定義します。すべての前提条件を満たすまで、データノードは "READY" とマークされません。	参照オブジェクト ("precondition":{"ref":"myPreconditionId"} など)
primaryKeys	`RedShiftCopyActivity` でコピー先テーブルの primaryKeys を指定しなかった場合は、primaryKeys を使用して列のリストを指定すると、これが mergeKey の役割を果たします。ただし、Amazon Redshift テーブルに primaryKey が既に定義されている場合は、この設定によって既存キーがオーバーライドされます。	String
reportProgressTimeout	reportProgress へのリモート作業の連続した呼び出しのタイムアウト。設定された場合、指定された期間の進捗状況を報告しないリモートアクティビティは停止されたと見なし、再試行できます。	期間
retryDelay	2 回の再試行の間のタイムアウト期間。	期間
runsOn	アクティビティまたはコマンドを実行するコンピューティングリソース。たとえば、Amazon EC2 インスタンスまたは Amazon EMR クラスター。	参照オブジェクト ("runsOn":{"ref":"myResourceId"} など)
scheduleType	スケジュールタイプによって、パイプライン定義のオブジェクトを、期間の最初にスケジュールするか、最後にスケジュールするかを指定できます。[Time Series Style Scheduling] は、インスタンスが各間隔の最後にスケジュールされることを意味し、[Cron Style Scheduling] は、インスタンスが各間隔の最初にスケジュールされることを意味します。オンデマンドスケジュールにより、アクティベーションごとに 1 回パイプラインを実行することができます。つまり、パイプラインを再実行するために、クローンしたり再作成したりする必要はありません。オンデマンドスケジュールを使用する場合は、デフォルトオブジェクトで指定し、パイプラインのオブジェクトに対して指定される唯一の scheduleType である必要があります。オンデマンドパイプラインを使用するには、それ以降の実行ごとに、ActivatePipeline オペレーションを呼び出すだけです。値は、cron、ondemand、および timeseries です。	一覧表
schemaName	このオプションフィールドは、Amazon Redshift テーブルのスキーマ名を指定します。指定されていない場合、スキーマ名が PUBLIC (Amazon Redshift のデフォルトスキーマ) であると見なされます。詳細については、「Amazon Redshift データベースデベロッパーガイド」を参照してください。	String
workerGroup	ワーカーグループ。これはルーティングタスクに使用されます。runsOn 値を指定して、workerGroup がある場合、workerGroup は無視されます。	String

実行時フィールド	説明	スロットタイプ
@activeInstances	現在スケジュールされているアクティブなインスタンスオブジェクトのリスト。	参照オブジェクト ("activeInstances":{"ref":"myRunnableObjectId"} など)
@actualEndTime	このオブジェクトの実行が終了した時刻。	DateTime
@actualStartTime	このオブジェクトの実行が開始された時刻。	DateTime
cancellationReason	このオブジェクトがキャンセルされた場合の cancellationReason。	String
@cascadeFailedOn	オブジェクトが失敗した際の依存関係チェーンの説明。	参照オブジェクト ("cascadeFailedOn":{"ref":"myRunnableObjectId"} など)
emrStepLog	EMR アクティビティの試行でのみ使用可能な EMR ステップログ	String
errorId	このオブジェクトが失敗した場合は errorId。	String
errorMessage	このオブジェクトが失敗した場合は errorMessage。	String
errorStackTrace	このオブジェクトが失敗した場合は、エラースタックトレース。	String
@finishedTime	このオブジェクトが実行を終了した時刻。	DateTime
hadoopJobLog	EMR ベースのアクティビティで試みることができる Hadoop ジョブのログ。	String
@healthStatus	終了状態に達した最後のオブジェクトインスタンスの成功または失敗を反映する、オブジェクトのヘルスステータス。	String
@healthStatusFromInstanceId	終了状態に達した最後のインスタンスオブジェクトの ID。	String
@healthStatusUpdatedTime	ヘルス状態が最後に更新された時間。	DateTime
hostname	タスクの試行を取得したクライアントのホスト名。	String
@lastDeactivatedTime	このオブジェクトが最後に非アクティブ化された時刻。	DateTime
@latestCompletedRunTime	実行が完了した最後の実行の時刻。	DateTime
@latestRunTime	実行がスケジュールされた最後の実行の時刻。	DateTime
@nextRunTime	次回にスケジュールされた実行の時刻。	DateTime
reportProgressTime	リモートアクティビティで進捗状況が報告された最新の時刻。	DateTime
@scheduledEndTime	オブジェクトの予定された終了時刻	DateTime
@scheduledStartTime	オブジェクトの予定された開始時刻	DateTime
@status	このオブジェクトのステータス。	String
@version	オブジェクトが作成されたパイプラインのバージョン。	String
@waitingOn	このオブジェクトが待機している依存関係のリストの説明。	参照オブジェクト ("waitingOn":{"ref":"myRunnableObjectId"} など)

システムフィールド	説明	スロットタイプ
@error	形式が正しくないオブジェクトを説明するエラー。	String
@pipelineId	このオブジェクトが属するパイプラインの ID。	String
@sphere	オブジェクトの球は、ライフサイクルにおける場所を示します。コンポーネントオブジェクトにより、試行オブジェクトを実行するインスタンスオブジェクトが発生します。	String

ブラウザで JavaScript が無効になっているか、使用できません。

AWS ドキュメントを使用するには、JavaScript を有効にする必要があります。手順については、使用するブラウザのヘルプページを参照してください。

ドキュメントの表記規則

MySqlDataNode

S3DataNode