Iceberg テーブルの列統計の生成 - AWS Glue

Iceberg テーブルの列統計の生成

以下の手順に従って、 AWS Glue コンソールまたは AWS CLI または を使用して Data Catalog で統計を生成するスケジュールを設定します。または、 StartColumnStatisticsTaskRunオペレーションを実行します。

列統計を生成するには
  1. で AWS Glue コンソールにサインインしますhttps://console.aws.amazon.com/glue/

  2. [データカタログ] の下の [テーブル] を選択します。

  3. リストから Iceberg テーブルを選択します。

  4. [アクション] メニューで、[列の統計][オンデマンドで生成] を選択します。

    [テーブル] ページの下のセクションにある [列統計] タブで [統計を生成] ボタンを選択することもできます。

  5. [統計を生成] ページで、統計の生成の詳細を入力します。スケジュールでの列統計の生成 セクションのステップ 6~11 に従って、Iceberg テーブルの統計生成のスケジュールを設定します。

    また、「」の手順に従って、列統計をオンデマンドで生成することもできます。 オンデマンドでの列統計の生成

    注記

    [サンプリング] オプションは Iceberg テーブルでは使用できません。

    AWS Glue は、Amazon S3 ロケーションで指定されたスナップショット ID にコミットされた新しい Puffin ファイルに対して Iceberg テーブルの各列の個別の値の数を計算します。