產生 Iceberg 資料表的資料欄統計資料 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

產生 Iceberg 資料表的資料欄統計資料

請依照下列步驟,使用 AWS Glue 主控台 或 AWS CLI 或 或執行 StartColumnStatisticsTaskRun 操作,設定在 Data Catalog 中產生統計資料的排程。

若要產生資料欄統計資料
  1. 在 登入 AWS Glue 主控台https://console.aws.amazon.com/glue/

  2. 選擇 Data Catalog 下的資料表

  3. 從清單中選擇 Iceberg 資料表。

  4. 選擇資料欄統計資料 隨需產生 動作選單下。

    您也可選擇資料表頁面下半區段之資料欄統計資料索引標籤下的產生統計資料按鈕。

  5. 產生統計資料頁面上,提供統計資料產生詳細資訊。請依照 在排程上產生資料欄統計資料區段中的步驟 6-11,設定 Iceberg 資料表統計資料產生排程。

    您也可以依照 中的說明,選擇隨需產生資料欄統計資料 依需求產生資料欄統計資料

    注意

    取樣選項不適用於 Iceberg 資料表。

    AWS Glue 會計算 Iceberg 資料表每欄的不同值數目,以傳送至 Amazon S3 位置中指定快照 ID 的新 Puffin 檔案。