SVCS_S3QUERY_SUMMARY
시스템에서 실행된 모든 Redshift Spectrum 쿼리(S3 쿼리)의 요약을 가져오려면 SVCS_S3QUERY_SUMMARY 뷰를 사용합니다. 한 개의 세그먼트로 한 개의 외부 테이블 스캔을 수행할 수 있습니다.
참고
접두사 SVCS를 포함하는 시스템 뷰는 동시성 확장 클러스터와 기본 클러스터 모두의 쿼리에 대한 세부 정보를 제공합니다. 이 뷰는 접두사 SVL을 포함하는 뷰와 유사합니다. 단, SVL 뷰는 기본 클러스터에서 실행된 쿼리에 대한 정보만 제공합니다.
SVCS_S3QUERY_SUMMARY는 모든 사용자에게 표시됩니다. 수퍼유저는 모든 행을 볼 수 있지만 일반 사용자는 자체 데이터만 볼 수 있습니다. 자세한 내용은 시스템 테이블 및 뷰에 있는 데이터의 가시성 단원을 참조하십시오.
SVL_S3QUERY에 대한 자세한 내용은 SVL_S3QUERY 섹션을 참조하세요.
테이블 열
열 명칭 | 데이터 유형 | 설명 |
---|---|---|
userid | 정수 | 지정된 항목을 생성한 사용자의 ID. |
쿼리 | 정수 | 쿼리 ID입니다. 이 값을 사용하여 다양한 다른 시스템 테이블 및 뷰를 조인할 수 있습니다. |
xid | bigint | 트랜잭션 ID. |
pid | 정수 | 프로세스 ID. |
segment | 정수 | 세그먼트 번호. 하나의 쿼리는 여러 세그먼트로 구성되며, 각각의 세그먼트는 하나 이상의 단계로 구성됩니다. |
step | 정수 | 실행된 쿼리 단계입니다. |
starttime | 타임스탬프 | 이 세그먼트의 Redshift Spectrum 쿼리가 실행되기 시작한 UTC 시간입니다. 한 개의 세그먼트로 한 개의 외부 테이블 스캔을 수행할 수 있습니다. |
endtime | 타임스탬프 | 이 세그먼트의 Redshift Spectrum 쿼리가 완료된 UTC 시간입니다. 한 개의 세그먼트로 한 개의 외부 테이블 스캔을 수행할 수 있습니다. |
elapsed | 정수 | 이 세그먼트의 Redshift Spectrum 쿼리가 실행되는 데 걸린 시간(마이크로초)입니다. |
aborted | 정수 | 쿼리가 시스템에 의해 중지되거나 사용자에 의해 취소되는 경우, 이 열에 1 이 포함됩니다. 쿼리가 실행되어 완료되면 이 열에 0 이 포함됩니다. |
external_table_name | char(136) | 외부 테이블 스캔을 위한 테이블 외부 이름의 내부 형식입니다. |
file_format | character(16) | 외부 테이블 데이터의 파일 형식입니다. |
is_partitioned | char(1) | true(t )인 경우, 이 열 값은 외부 테이블이 파티셔닝되어 있음을 나타냅니다. |
is_rrscan | char(1) | true(t )인 경우, 이 열 값은 범위 제한 스캔이 적용되었음을 나타냅니다. |
is_nested | varchar(1) | true(t )인 경우 이 열 값은 중첩 열 데이터 형식에 액세스했음을 나타냅니다. |
s3_scanned_rows | bigint | Amazon S3에서 스캔되어 Redshift Spectrum 계층으로 전송된 행의 수. |
s3_scanned_bytes | bigint | 압축된 데이터를 기반으로 Amazon S3에서 스캔되어 Redshift Spectrum 계층으로 전송된 바이트의 수. |
s3query_returned_rows | bigint | Redshift Spectrum 계층에서 클러스터로 반환된 행의 수. |
s3query_returned_bytes | bigint | Redshift Spectrum 계층에서 클러스터로 반환된 바이트의 수. Amazon Redshift로 반환되는 데이터의 양이 많으면 시스템 성능이 영향을 받을 수 있습니다. |
files | 정수 | 이 Redshift Spectrum 쿼리에 대해 처리된 파일의 수. 파일 수가 적으면 병렬 처리의 이점이 제한됩니다. |
files_max | 정수 | 한 조각에서 처리된 파일의 최대 개수. |
files_avg | 정수 | 한 조각에서 처리된 파일의 평균 개수. |
splits | bigint | 이 세그먼트에 대해 처리되는 분할 수입니다. 이 조각에서 처리되는 분할 수입니다. 분할할 수 있는 큰 데이터 파일의 경우, 예를 들어 약 512MB보다 큰 데이터 파일의 경우 Redshift Spectrum은 병렬 처리를 위해 파일을 여러 개의 S3 요청으로 분할하려고 합니다. |
splits_max | 정수 | 이 조각에서 처리되는 최대 분할 수입니다. |
splits_avg | bigint | 이 조각에서 처리되는 평균 분할 수입니다. |
total_split_size | bigint | 처리되는 모든 분할의 총 크기입니다. |
max_split_size | bigint | 처리되는 최대 분할 크기(바이트)입니다. |
avg_split_size | bigint | 처리되는 평균 분할 크기(바이트)입니다. |
total_retries | bigint | 이 세그먼트에서 Redshift Spectrum 쿼리에 대한 총 재시도 횟수입니다. |
max_retries | 정수 | 처리된 개별 파일의 최대 재시도 횟수입니다. |
max_request_duration | bigint | 개별 파일 요청의 최대 지속 시간(마이크로초)입니다. 오랫동안 실행 중인 쿼리는 병목 현상을 나타낼 수 있습니다. |
avg_request_duration | bigint | 파일 요청의 평균 지속 시간(마이크로초)입니다. |
max_request_parallelism | 정수 | 이 Redshift Spectrum 쿼리에 대해 한 개의 조각에 있는 최대 병렬 요청 수입니다. |
avg_request_parallelism | double precision | 이 Redshift Spectrum 쿼리에 대해 한 개의 조각에 있는 평균 병렬 요청 수입니다. |
total_slowdown_count | bigint | 외부 테이블 스캔 중에 속도가 느려지는 오류가 발생한 총 Amazon S3 요청 수입니다. |
max_slowdown_count | 정수 | 한 조각의 외부 테이블 스캔 중에 속도가 느려지는 오류가 발생한 최대 Amazon S3 요청 수입니다. |
샘플 쿼리
다음 예는 마지막으로 실행된 쿼리에 대한 스캔 단계 세부 정보를 가져옵니다.
select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svcs_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files ------+---------+---------+-----------------+------------------+-----------------------+------------------------+------ 4587 | 2 | 67811 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 591568 | 172462 | 11260097 | 8513 | 170260 | 1 4587 | 2 | 216849 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 216671 | 0 | 0 | 0 | 0 | 0