列統計の表示 - AWS Glue

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

列統計の表示

統計が正常に生成された後、Data Catalog はこの情報をコストベースのオプティマイザ用に Amazon Athena および Amazon Redshift に保存し、クエリの実行時に最適な選択を行います。統計は列のタイプによって異なります。

AWS Management Console
テーブルの列統計を表示するには
  • 列統計タスクを実行すると、[テーブルの詳細] ページの [列統計] タブにテーブルの統計が表示されます。

    スクリーンショットは、最新の実行から生成された列を示しています。

    次の統計を使用できます。

    • [列名]: 統計を生成するために使用される列名

    • [最終更新日時]: 統計が生成された日時

    • [平均長]: 列内の値の平均長

    • [個別の値]: 列内の個別の値の合計数。列内の個別の値の数を 5% の相対誤差で推定します。

    • [最大値]: 列内の最大値。

    • [最小値]: 列内の最小値。

    • [最大長]: 列内の最大値の長さ。

    • [Null 値]: 列内の null 値の合計数。

    • [True 値]: 列内の true 値の合計数。

    • [False 値]: 列内の false 値の合計数。

    • numFiles: テーブル内のファイルの合計数。この値は、[詳細プロパティ] タブで使用できます。

AWS CLI

次の例は、 AWS CLIを使用して列統計を取得する方法を示しています。

aws glue get-column-statistics-for-table \ --database-name database_name \ --table-name table_name \ --column-names <column_name>

GetColumnStatisticsForTable API オペレーションを使用して列統計を表示することもできます。