替换为最常见 - AWS Glue DataBrew

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

替换为最常见

将列中的每个无效值替换为最常出现的列值。

参数
  • sourceColumn – 现有列的名称。

  • columnDataType列的数据类型。

  • advancedDataType— 在具有该数据类型的列 DataBrew 中检测到的特殊数据类型string。 DataBrew 可以在string列中检测到的类型包括 SSN、电子邮件、电话号码、性别、信用卡、URL、IP 地址、 DateTime、货币、 ZipCode、国家、地区、州和城市。

例 示例

{ "RecipeAction": { "Operation": "REPLACE_WITH_MOST_FREQUENT", "Parameters": { "columnDataType": "string", "sourceColumn": "wind_direction" } } }