GROUP_BY - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

GROUP_BY

通过按一列或多列对行进行分组,然后对每个组应用聚合函数来汇总数据。

参数
  • sourceColumns— 一个 JSON 编码的字符串,表示构成每个组基础的列的列表。

  • groupByAggFunctions— 一个 JSON 编码的字符串,表示要应用的聚合函数列表。(如果您不想要聚合,请指定UNAGGREGATED。)

  • useNewDataFrame— 如果为 true,GROUP_BY 的结果将在项目会话中可用,替换其当前内容。

例 示例

[ { "Action": { "Operation": "GROUP_BY", "Parameters": { "groupByAggFunctionOptions": "[{\"sourceColumnName\":\"all_votes\",\"targetColumnName\":\"all_votes_count\",\"targetColumnDataType\":\"number\",\"functionName\":\"COUNT\"}]", "sourceColumns": "[\"year\",\"state_name\"]", "useNewDataFrame": "true" } } } ]