列映射选项
默认情况下,COPY 会按字段在数据文件中出现的相同顺序将值插入到目标表的列中。如果默认列顺序不起作用,则可以指定一个列列表或使用 JSONPath 表达式将源数据字段映射到目标列。
列列表
您可以指定列名称的逗号分隔列表以将源数据字段加载到特定目标列中。这些列在 COPY 语句中可以采用任何顺序,但是,当从平面文件加载时(如在 Amazon S3 桶中),它们的顺序必须与源数据的顺序一致。
从 Amazon DynamoDB 表加载时,顺序并不重要。COPY 命令将从 DynamoDB 表中检索到的项中的属性名称与 Amazon Redshift 表中的列名进行匹配。有关更多信息,请参阅从 Amazon DynamoDB 表中加载数据
列列表的格式如下所示。
COPY tablename (column1 [,column2, ...])
如果列列表省略了目标表中的列,则 COPY 将加载目标列的 DEFAULT 表达式。
如果目标列没有默认值,则 COPY 将尝试加载 NULL。
如果 COPY 尝试将 NULL 分配到一个定义为 NOT NULL 的列,COPY 命令将失败。
如果 IDENTITY 列包含在列列表中,则还必须指定 EXPLICIT_IDS;如果省略了 IDENTITY 列,则无法指定 EXPLICIT_IDS。如果未指定任何列列表,则该命令将如同指定了一个完整、有序的列列表一样来执行,如果也未指定 EXPLICIT_IDS,则会省略 IDENTITY 列。
如果某个列使用 GENERATED BY DEFAULT AS IDENTITY 进行定义,则可以复制该列。使用您提供的值生成或更新值。EXPLICIT_IDS 选项不是必需项。COPY 不会更新身份高级别水印。有关更多信息,请参阅 GENERATED BY DEFAULT AS IDENTITY。
JSONPaths 文件
当从 JSON 或 Avro 格式的数据文件加载时,COPY 会将 JSON 或 Avro 源数据中的数据元素自动映射到目标表中的列。它的执行方式是通过将 Avro schema 中的字段名称与目标表或列列表中的列名称相匹配。
在某些情况下,您的列名称与字段名称不匹配,或者您需要映射到数据层次结构中的更深层次。在这些情况下,您可以使用 JSONPaths 文件将 JSON 或 Avro 数据元素显式映射到列。
有关更多信息,请参阅 JSONPaths 文件。