檢視資料欄統計資料 - AWS Glue

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

檢視資料欄統計資料

成功產生統計資料後,資料型錄會將此資訊儲存在以成本為基礎的最佳化工具 Amazon Athena 和 Amazon Redshift 中,以便在執行查詢時做出最佳選擇。統計資料會根據資料欄類型而異。

AWS Management Console
檢視資料表的資料欄統計資料
  • 執行資料欄統計資料任務後,資料表詳細資料頁面中的資料欄統計資料索引標籤會顯示資料表的統計資料。

    螢幕擷取畫面顯示最近一次執行所產生的資料欄。

    下列為可用的統計資料:

    • 資料欄名稱:用來產生統計資料的資料欄名稱

    • 上次更新:統計資料產生時的資料和時間

    • 平均長度:資料欄中值的平均長度

    • 相異值:資料欄中的相異值總數。我們會以 5% 相對誤差率預估資料欄中相異值數。

    • 最大值:資料欄中的最大值。

    • 最小值:資料欄中的最小值。

    • 最大長度:資料欄中的最高值長度。

    • Null 值:資料欄中的 Null 值總數。

    • True 值:資料欄中的 true 值總數。

    • False 值:資料欄中的 false 值總數。

    • NUMFiles:表格中的檔案總數。此值可在 [進階屬性] 索引標籤下找到。

AWS CLI

下列範例顯示如何使用 AWS CLI擷取資料欄統計資料。

aws glue get-column-statistics-for-table \ --database-name <test_db> \ --table-name <test_tble> \ --column-names <col1>

您也可以使用 GetColumnStatisticsForTableAPI 作業檢視資料行統計資料。