SVL_S3QUERY_SUMMARY - Amazon Redshift

SVL_S3QUERY_SUMMARY

SVL_S3QUERY_SUMMARY ビューを使用して、システムで実行されたすべての Amazon Redshift Spectrum クエリ (S3 クエリ) 概要を取得します。SVL_S3QUERY_SUMMARY は、SVL_S3QUERY の詳細をセグメントレベルで集計します。

SVL_S3QUERY_SUMMARY はすべてのユーザーに表示されます。スーパーユーザーはすべての行を表示できますが、通常のユーザーは自分のデータのみを表示できます。詳細については、「システムテーブルとビューのデータの可視性」を参照してください。

このテーブルの一部またはすべてのデータは、SYS モニタリングビュー SYS_EXTERNAL_QUERY_DETAIL でも確認できます。SYS モニタリングビューのデータは、使いやすく理解しやすいようにフォーマットされます。クエリには、SYS モニタリングビューを使用することをお勧めします。

SVCS_S3QUERY_SUMMARY については、「SVCS_S3QUERY_SUMMARY」を参照してください。

テーブルの列

列名 データ型 説明
userid integer 指定のエントリを生成したユーザーの ID。
query integer クエリ ID。この値を使用して、他の各種システムテーブルおよびビューを結合できます。
xid bigint トランザクション ID。
pid integer プロセス ID。
segment integer セグメント番号。複数のセグメントから構成された 1 つのクエリ。各セグメントは 1 つ以上のステップから構成されます。
step integer 実行したクエリステップ。
starttime timestamp クエリの実行が開始された時間 (UTC)。
endtime timestamp クエリの完了した時間 (UTC)。
elapsed integer クエリの実行にかかった時間の長さ (マイクロ秒)。
aborted integer クエリがシステムによって停止されたかユーザーによってキャンセルされた場合、この列は 1 になります。クエリが最後まで実行された場合、この列は 0 になります。
external_table_name char(136) 外部テーブルスキャンのテーブルの外部名の内部形式。
file_format character(16) 外部テーブルデータのファイル形式。
is_partitioned char(1) true (t) の場合、この列の値は外部テーブルがパーティション化されていることを示します。
is_rrscan char(1) true (t) の場合、この列の値は範囲限定スキャンが適用されたことを示します。
is_nested char(1) true (t) の場合、この列の値は、ネストされた列のデータ型にアクセスされていることを示します。
s3_scanned_rows bigint Amazon S3 からスキャンされ、Redshift Spectrum レイヤーに送信された行数。
s3_scanned_bytes bigint Amazon S3 からスキャンされ Redshift Spectrum レイヤーに送信されたバイト数 (圧縮データに基づく)。
s3query_returned_rows bigint Redshift Spectrum レイヤーからクラスターに返された行数。
s3query_returned_bytes bigint Redshift Spectrum レイヤーからクラスターに返されたバイト数。Amazon Redshift に大量のデータが返されると、システムパフォーマンスに影響が及ぶ可能性があります。
files integer この Redshift Spectrum クエリで処理されたファイル数。ファイル数が少ないと、並列処理の利点は制限されます。
files_max integer 1 つのスライスで処理されるファイルの最大数。
files_avg integer 1 つのスライスで処理されるファイルの平均数。
splits int このセグメントで処理された分割の数。このスライスで処理された分割の数。例えば分割可能なデータファイルの容量が大きい場合 (約 512 MB を超えるデータファイルなど)、Redshift Spectrum はファイルを複数の S3 リクエストに分割し、並列処理を試みます。
splits_max int このスライスで処理された分割の最大数。
splits_avg int このスライスで処理された分割の平均数。
total_split_size bigint 処理されたすべての分割の合計サイズ。
max_split_size bigint 処理された分割の最大サイズ (単位: バイト)。
avg_split_size bigint 処理された分割の平均サイズ (単位: バイト)。
total_retries integer 個別の処理ファイルでの再試行の総数。
max_retries integer 処理ファイルでの再試行の最大数。
max_request_duration integer 個別ファイルリクエストの最長時間 (マイクロ秒)。実行時間の長いクエリはボトルネックの可能性があります。
avg_request_duration double precision ファイルリクエストの平均時間 (マイクロ秒)。
max_request_parallelism integer Redshift Spectrum クエリでの 1 つのスライスの並列リクエストの最大数。
avg_request_parallelism double precision Redshift Spectrum クエリでの 1 つのスライスの並列リクエストの平均数。
total_slowdown_count bigint 外部テーブルスキャン中に発生したスローダウンエラーを含む Amazon S3 リクエストの合計数。
max_slowdown_count integer 外部テーブルスキャン中に 1 つのスライスで発生したスローダウンエラーを含む Amazon S3 リクエストの最大数。

サンプルクエリ

以下の例は、最後に完了されたクエリに関するスキャンステップの詳細を取得します。

select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0