[集計] を使用して選択したフィールドに対して集約計算を実行する
Aggregate transform を使用するには
-
Aggregate ノードをジョブダイアグラムに追加します。
-
Node propertiesタブ上で、ドロップダウンフィールド (オプション) を選択して、一緒にグループ化するフィールドを選択します。一度に複数のフィールドを選択するか、検索バーに入力してフィールド名を検索できます。
フィールドを選択すると、名前とデータ型が表示されます。フィールドを削除するには、フィールドで [X] を選択します。
-
[Aggregate another column]を選択します。少なくとも 1 つのフィールドを選択する必要があります。
-
[Field to aggregate]ドロップダウン中のフィールドを選択します。
-
選択したフィールドに適用する集計関数を選択します:
-
avg-平均を計算します。
-
CountDistinct-一意の非ヌル値の数を計算します。
-
count-非 null 値の数を計算します。
-
first-「グループ別」の基準を満たす最初の値を返します。
-
last-「グループ別」の基準を満たす最後の値を返します。
-
kurtosis-周波数ディストリビューション曲線のピークのシャープネスを計算します。
-
max-「グループ別」の基準を満たす最高値を返します。
-
min-「グループ別」の基準を満たす最小値を返します。
-
skewness-正規ディストリビューションの確率ディストリビューションの非対称性の尺度
-
stddev_pop-母標準偏差を計算し、母分散の平方根を返します。
-
sum-グループ内のすべての値の合計
-
sumDistinct-グループ内の個別の値の合計
-
var_samp-グループのサンプル分散 (ヌルは無視されます)
-
var_pop-グループの母分散 (ヌルは無視されます)
-