[集計] を使用して選択したフィールドに対して集約計算を実行する - AWS Glue

[集計] を使用して選択したフィールドに対して集約計算を実行する

Aggregate transform を使用するには
  1. Aggregate ノードをジョブダイアグラムに追加します。

  2. Node propertiesタブ上で、ドロップダウンフィールド (オプション) を選択して、一緒にグループ化するフィールドを選択します。一度に複数のフィールドを選択するか、検索バーに入力してフィールド名を検索できます。

    フィールドを選択すると、名前とデータ型が表示されます。フィールドを削除するには、フィールドで [X] を選択します。

    スクリーンショットは、Aggregate ノードの [Transform] タブを示しています。
  3. [Aggregate another column]を選択します。少なくとも 1 つのフィールドを選択する必要があります。

    スクリーンショットは、[別の列を集約] を選択したときのフィールドを示しています。
  4. [Field to aggregate]ドロップダウン中のフィールドを選択します。

  5. 選択したフィールドに適用する集計関数を選択します:

    • avg-平均を計算します。

    • CountDistinct-一意の非ヌル値の数を計算します。

    • count-非 null 値の数を計算します。

    • first-「グループ別」の基準を満たす最初の値を返します。

    • last-「グループ別」の基準を満たす最後の値を返します。

    • kurtosis-周波数ディストリビューション曲線のピークのシャープネスを計算します。

    • max-「グループ別」の基準を満たす最高値を返します。

    • min-「グループ別」の基準を満たす最小値を返します。

    • skewness-正規ディストリビューションの確率ディストリビューションの非対称性の尺度

    • stddev_pop-母標準偏差を計算し、母分散の平方根を返します。

    • sum-グループ内のすべての値の合計

    • sumDistinct-グループ内の個別の値の合計

    • var_samp-グループのサンプル分散 (ヌルは無視されます)

    • var_pop-グループの母分散 (ヌルは無視されます)