自定义数据格式 - AWS Data Pipeline

AWS Data Pipeline 不再向新客户提供。的现有客户 AWS Data Pipeline 可以继续照常使用该服务。了解更多

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

自定义数据格式

由特定的列分隔符、记录分隔符和转义字符组合定义的自定义数据格式。

示例

以下是该对象类型的示例。

{ "id" : "MyOutputDataType", "type" : "Custom", "columnSeparator" : ",", "recordSeparator" : "\n", "column" : [ "Name STRING", "Score INT", "DateOfBirth TIMESTAMP" ] }

语法

必填字段 描述 槽类型
columnSeparator 一个指示数据文件中的列结尾的字符。 String

可选字段 描述 槽类型
column 具有该数据节点描述的数据的各个字段指定的数据类型的列名。例如:hostname STRING 对于多个值,请使用用空格分隔的列名和数据类型。 String
parent 槽将继承自的当前对象的父级。 引用对象,例如 “父对象”:{"ref”:” myBaseObject Id "}
recordSeparator 一个指示数据文件中的行结尾的字符,例如“\n”。仅支持单个字符。 String

运行时字段 描述 槽类型
@version 用来创建对象的管道版本。 String

系统字段 描述 槽类型
@error 用于描述格式不正确的对象的错误消息 String
@pipelineId 该对象所属的管道的 ID String
@sphere 对象的范围指明对象在生命周期中的位置:组件对象产生实例对象,后者执行尝试对象 String