翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
列統計の表示
統計が正常に生成された後、Data Catalog はこの情報をコストベースのオプティマイザ用に Amazon Athena および Amazon Redshift に保存し、クエリの実行時に最適な選択を行います。統計は列のタイプによって異なります。
- AWS Management Console
-
テーブルの列統計を表示するには
-
列統計タスクを実行すると、[テーブルの詳細] ページの [列統計] タブにテーブルの統計が表示されます。
次の統計を使用できます。
[列名]: 統計を生成するために使用される列名
[最終更新日時]: 統計が生成された日時
[平均長]: 列内の値の平均長
[個別の値]: 列内の個別の値の合計数。列内の個別の値の数を 5% の相対誤差で推定します。
[最大値]: 列内の最大値。
[最小値]: 列内の最小値。
[最大長]: 列内の最大値の長さ。
[Null 値]: 列内の null 値の合計数。
[True 値]: 列内の true 値の合計数。
[False 値]: 列内の false 値の合計数。
-
numFiles: テーブル内のファイルの合計数。この値は、[詳細プロパティ] タブで使用できます。
-
- AWS CLI
-
次の例は、 AWS CLIを使用して列統計を取得する方法を示しています。
aws glue get-column-statistics-for-table \ --database-name
database_name
\ --table-nametable_name
\ --column-names<column_name>
GetColumnStatisticsForTable API オペレーションを使用して列統計を表示することもできます。
オンデマンドでの列統計の生成
列統計タスクの実行の表示