優化冰山表

隨著 Iceberg 資料表中的資料累積，由於開啟檔案時所需的處理時間增加，查詢的效率會逐漸降低。如果資料表內含 delete 檔案，則運算成本會更高。Iceberg 中的 delete 檔案會儲存資料列級的刪除內容，引擎查詢結果時也必須將已刪除的資料列納入查詢範圍。

為了最佳化 Iceberg 資料表查詢的效能，Athena 支援使用手動壓縮的資料表維護命令。壓縮可在不改變資料表內容的情況下，最佳化資料表的版面配置。

OPTIMIZE

OPTIMIZE table REWRITE DATA 壓縮動作會根據相關 delete 檔案的大小和數量，將資料檔案重寫成更好的版面配置。如需有關語法和資料表屬性的詳細資訊，則請參閱 OPTIMIZE。

下列範例將 delete 檔案合併到資料檔案中，並產生接近目標檔案大小的檔案，其中 category 的值是 c1。


OPTIMIZE iceberg_table REWRITE DATA USING BIN_PACK
  WHERE category = 'c1'

VACUUM 會執行快照過期和孤立檔案移除。這些動作會減少中繼資料大小，並移除不在目前資料表狀態的檔案，這些檔案也早於為資料表指定的保留期間。如需有關語法的詳細資訊，則請參閱 VACUUM。

下列範例會使用資料表屬性來將資料表 iceberg_table 設定為保留最近三天的資料，然後使用 VACUUM 將舊快照集設為過期，並從資料表中移除孤立檔案。


ALTER TABLE iceberg_table SET TBLPROPERTIES (
  'vacuum_max_snapshot_age_seconds'='259200'
)

VACUUM iceberg_table

您的瀏覽器已停用或無法使用 Javascript。

您必須啟用 Javascript，才能使用 AWS 文件。請參閱您的瀏覽器說明頁以取得說明。

其他 Iceberg DDL 操作

支援的資料類型