使用“串联列”转换来附加列 - AWS Glue

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用“串联列”转换来附加列

串联转换允许使用带有可选间隔符的其他列的值来生成新的字符串列。例如,如果我们将串联的列“日期”定义为“年”、“月”和“日”(按此顺序)的串联,并以“-”作为间隔符,则会得到:

day month year date
01 01 2020 2020-01-01
02 01 2020 2020-01-02
03 01 2020 2020-01-03
04 01 2020 2020-01-04
要添加串联转换,请执行以下操作:
  1. 打开资源面板。然后选择“串联列”,将新的转换添加到作业图。添加节点时选择的节点将是其父节点。

  2. (可选)在节点属性选项卡上,输入任务图中节点的名称。如果尚未选择父节点,请从 Node parents (父节点) 列表中选择一个节点,用作转换的输入源。

  3. 转换选项卡上,输入用于保存串联字符串的列的名称以及要串联的列。您检查下拉列表中各列的顺序将是使用的顺序。

    屏幕截图显示了“串联”转换的“转换”选项卡。
  4. 间隔符 — 可选 — 输入要在串联的字段之间放置的字符串。默认无间隔符。

  5. 空值 — 可选 — 输入列值为空时要使用的字符串。默认情况下,如果列的值为“NULL”或“NA”,则使用空字符串。