SVL_S3QUERY_SUMMARY
SVL_S3QUERY_SUMMARY ビューを使用して、システムで実行されたすべての Amazon Redshift Spectrum クエリ (S3 クエリ) 概要を取得します。SVL_S3QUERY_SUMMARY は、SVL_S3QUERY の詳細をセグメントレベルで集計します。
SVL_S3QUERY_SUMMARY はすべてのユーザーに表示されます。スーパーユーザーはすべての行を表示できますが、通常のユーザーは自分のデータのみを表示できます。詳細については、「システムテーブルとビューのデータの可視性」を参照してください。
このテーブルの一部またはすべてのデータは、SYS モニタリングビュー SYS_EXTERNAL_QUERY_DETAIL でも確認できます。SYS モニタリングビューのデータは、使いやすく理解しやすいようにフォーマットされます。クエリには、SYS モニタリングビューを使用することをお勧めします。
SVCS_S3QUERY_SUMMARY については、「SVCS_S3QUERY_SUMMARY」を参照してください。
テーブルの列
列名 | データ型 | 説明 |
---|---|---|
userid | integer | 指定のエントリを生成したユーザーの ID。 |
query | integer | クエリ ID。この値を使用して、他の各種システムテーブルおよびビューを結合できます。 |
xid | bigint | トランザクション ID。 |
pid | integer | プロセス ID。 |
segment | integer | セグメント番号。複数のセグメントから構成された 1 つのクエリ。各セグメントは 1 つ以上のステップから構成されます。 |
step | integer | 実行したクエリステップ。 |
starttime | timestamp | クエリの実行が開始された時間 (UTC)。 |
endtime | timestamp | クエリの完了した時間 (UTC)。 |
elapsed | integer | クエリの実行にかかった時間の長さ (マイクロ秒)。 |
aborted | integer | クエリがシステムによって停止されたかユーザーによってキャンセルされた場合、この列は 1 になります。クエリが最後まで実行された場合、この列は 0 になります。 |
external_table_name | char(136) | 外部テーブルスキャンのテーブルの外部名の内部形式。 |
file_format | character(16) | 外部テーブルデータのファイル形式。 |
is_partitioned | char(1) | true (t ) の場合、この列の値は外部テーブルがパーティション化されていることを示します。 |
is_rrscan | char(1) | true (t ) の場合、この列の値は範囲限定スキャンが適用されたことを示します。 |
is_nested | char(1) | true (t ) の場合、この列の値は、ネストされた列のデータ型にアクセスされていることを示します。 |
s3_scanned_rows | bigint | Amazon S3 からスキャンされ、Redshift Spectrum レイヤーに送信された行数。 |
s3_scanned_bytes | bigint | Amazon S3 からスキャンされ Redshift Spectrum レイヤーに送信されたバイト数 (圧縮データに基づく)。 |
s3query_returned_rows | bigint | Redshift Spectrum レイヤーからクラスターに返された行数。 |
s3query_returned_bytes | bigint | Redshift Spectrum レイヤーからクラスターに返されたバイト数。Amazon Redshift に大量のデータが返されると、システムパフォーマンスに影響が及ぶ可能性があります。 |
files | integer | この Redshift Spectrum クエリで処理されたファイル数。ファイル数が少ないと、並列処理の利点は制限されます。 |
files_max | integer | 1 つのスライスで処理されるファイルの最大数。 |
files_avg | integer | 1 つのスライスで処理されるファイルの平均数。 |
splits | int | このセグメントで処理された分割の数。このスライスで処理された分割の数。例えば分割可能なデータファイルの容量が大きい場合 (約 512 MB を超えるデータファイルなど)、Redshift Spectrum はファイルを複数の S3 リクエストに分割し、並列処理を試みます。 |
splits_max | int | このスライスで処理された分割の最大数。 |
splits_avg | int | このスライスで処理された分割の平均数。 |
total_split_size | bigint | 処理されたすべての分割の合計サイズ。 |
max_split_size | bigint | 処理された分割の最大サイズ (単位: バイト)。 |
avg_split_size | bigint | 処理された分割の平均サイズ (単位: バイト)。 |
total_retries | integer | 個別の処理ファイルでの再試行の総数。 |
max_retries | integer | 処理ファイルでの再試行の最大数。 |
max_request_duration | integer | 個別ファイルリクエストの最長時間 (マイクロ秒)。実行時間の長いクエリはボトルネックの可能性があります。 |
avg_request_duration | double precision | ファイルリクエストの平均時間 (マイクロ秒)。 |
max_request_parallelism | integer | Redshift Spectrum クエリでの 1 つのスライスの並列リクエストの最大数。 |
avg_request_parallelism | double precision | Redshift Spectrum クエリでの 1 つのスライスの並列リクエストの平均数。 |
total_slowdown_count | bigint | 外部テーブルスキャン中に発生したスローダウンエラーを含む Amazon S3 リクエストの合計数。 |
max_slowdown_count | integer | 外部テーブルスキャン中に 1 つのスライスで発生したスローダウンエラーを含む Amazon S3 リクエストの最大数。 |
サンプルクエリ
以下の例は、最後に完了されたクエリに関するスキャンステップの詳細を取得します。
select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files ------+---------+---------+-----------------+------------------+-----------------------+------------------------+------ 4587 | 2 | 67811 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 591568 | 172462 | 11260097 | 8513 | 170260 | 1 4587 | 2 | 216849 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 216671 | 0 | 0 | 0 | 0 | 0