Iceberg テーブルの列統計の生成
以下の手順に従って、 AWS Glue コンソールまたは AWS CLI または を使用して Data Catalog で統計を生成するスケジュールを設定します。または、 StartColumnStatisticsTaskRunオペレーションを実行します。
列統計を生成するには
-
で AWS Glue コンソールにサインインしますhttps://console.aws.amazon.com/glue/
。 -
[データカタログ] の下の [テーブル] を選択します。
-
リストから Iceberg テーブルを選択します。
-
[アクション] メニューで、[列の統計] の [オンデマンドで生成] を選択します。
[テーブル] ページの下のセクションにある [列統計] タブで [統計を生成] ボタンを選択することもできます。
-
[統計を生成] ページで、統計の生成の詳細を入力します。スケジュールでの列統計の生成 セクションのステップ 6~11 に従って、Iceberg テーブルの統計生成のスケジュールを設定します。
また、「」の手順に従って、列統計をオンデマンドで生成することもできます。 オンデマンドでの列統計の生成
注記
[サンプリング] オプションは Iceberg テーブルでは使用できません。
AWS Glue は、Amazon S3 ロケーションで指定されたスナップショット ID にコミットされた新しい Puffin ファイルに対して Iceberg テーブルの各列の個別の値の数を計算します。