联合 - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

联合

将两个或更多数据集中的行合并到单个结果中。

参数
  • datasetsColumns— 一个 JSON 编码的字符串,表示数据集中所有列的列表。

  • secondaryDatasetNames— 一个 JSON 编码的字符串,表示一个或多个辅助数据集的列表。

  • secondaryInputs— 一个 JSON 编码的字符串,表示 Amazon S3 存储桶和对象密钥名称的列表,这些名称告诉 DataBrew 在哪里可以找到辅助数据集。

  • targetColumnNames— 一个 JSON 编码的字符串,表示结果的列名列表。

例 示例

{ "Action": { "Operation": "UNION", "Parameters": { "datasetsColumns": "[[\"assembly_session\",\"state_code\",\"state_name\",\"year\",\"all_votes\",\"yes_votes\",\"no_votes\",\"abstain\",\"idealpoint_estimate\",\"affinityscore_usa\",\"affinityscore_russia\",\"affinityscore_china\",\"affinityscore_india\",\"affinityscore_brazil\",\"affinityscore_israel\"],[\"assembly_session\",\"state_code\",\"state_name\",null,null,null,null,null,null,null,null,null,null,null,null]]", "secondaryDatasetNames": "[\"votes\"]", "secondaryInputs": "[{\"S3InputDefinition\":{\"Bucket\":\"databrew-public-datasets-us-east-1\",\"Key\":\"votes.csv\"}}]", "targetColumnNames": "[\"assembly_session\",\"state_code\",\"state_name\",\"year\",\"all_votes\",\"yes_votes\",\"no_votes\",\"abstain\",\"idealpoint_estimate\",\"affinityscore_usa\",\"affinityscore_russia\",\"affinityscore_china\",\"affinityscore_india\",\"affinityscore_brazil\",\"affinityscore_israel\"]" } } }