数据结构配方步骤 - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据结构配方步骤

使用这些配方步骤从不同的角度对数据进行制表和汇总,或者执行高级功能。

SCALE

缩放或标准化数值列中的数据范围。

参数
  • sourceColumn— 现有列的名称。

  • strategy— 要应用于列值的操作:

    • MIN_MAX— 将值重新缩放到 [0,1] 范围内。

    • SCALE_BETWEEN— 将值重新缩放到两个指定值的范围内。

    • MEAN_NORMALIZATION— 在 [-1, 1] 的范围内重新调整数据的平均值 (μ) 为 0,标准差 (σ) 为 1。

    • Z_SCORE— 对数据值进行线性缩放,使平均值 (μ) 为 0,标准差 (σ) 为 1。最适合处理异常值。

  • targetColumn— 要包含结果的列的名称。

例 示例

{ "Action": { "Operation": "NORMALIZATION", "Parameters": { "sourceColumn": "all_votes", "strategy": "MIN_MAX", "targetColumn": "all_votes_normalized" } } }