SVL_S3QUERY_SUMMARY - Amazon Redshift

SVL_S3QUERY_SUMMARY

Utilice la vista SVL_S3QUERY_SUMMARY para obtener un resumen de todas las consultas de Amazon Redshift Spectrum (consultas S3) que se ejecutaron en el sistema. SVL_S3QUERY_SUMMARY agrega detalles de la vista SVL_S3QUERY a nivel segmento.

SVL_S3QUERY_SUMMARY es visible para todos los usuarios. Los superusuarios pueden ver todas las filas; los usuarios normales solo pueden ver sus datos. Para obtener más información, consulte Visibilidad de datos en las tablas y vistas de sistema.

Algunos o todos los datos de esta tabla también están en la vista de monitoreo SYS SYS_EXTERNAL_QUERY_DETAIL. Los datos de la vista de monitoreo SYS están formateados para que sean más fáciles de usar y entender. Se recomienda utilizar la vista de monitoreo SYS para las consultas.

Para obtener más información sobre SVCS_S3QUERY_SUMMARY, consulte SVCS_S3QUERY_SUMMARY.

Columnas de la tabla

Nombre de la columna Tipo de datos Descripción
userid integer ID del usuario que generó la entrada dada.
consulta integer El ID de la consulta. Puede usar este valor para combinar distintas vistas y tablas del sistema.
xid bigint El ID de la transacción.
pid integer El ID del proceso.
segment integer El número del segmento. Una consulta consta de distintos segmentos y cada segmento consta de uno o más pasos.
paso integer El paso de la consulta que se ejecutó.
starttime Marca de tiempo Hora en UTC en que comenzó a ejecutarse la consulta.
endtime Marca de tiempo Hora en UTC en que se completó la consulta.
elapsed integer Tiempo que demoró la consulta en ejecutarse (en microsegundos).
aborted integer Si el sistema detuvo la consulta o el usuario la canceló, esta columna tendrá el valor 1. Si la consulta se ejecutó hasta su finalización, esta columna tendrá el valor 0.
external_table_name char (136) El formato interno del nombre del nombre externo de la tabla para el examen de la tabla externa.
file_format character(16) El formato de archivo de los datos de la tabla externa.
is_partitioned char(1) Si es true (t), el valor de esta columna indica que la tabla externa está particionada.
is_rrscan char (1) Si es true (t), el valor de esta columna indica que se aplicó un examen de rango restringido.
is_nested char(1) Si es true (t), el valor de esta columna indica que se obtuvo acceso al tipo de datos de la columna anidada.
s3_scanned_rows bigint La cantidad de filas examinadas desde Amazon S3 y enviadas a la capa de Redshift Spectrum.
s3_scanned_bytes bigint La cantidad de bytes examinados desde Amazon S3 y enviados a la capa de Redshift Spectrum, según los datos comprimidos.
s3query_returned_rows bigint La cantidad de filas devueltas desde la capa Redshift Spectrum hasta el clúster.
s3query_returned_bytes bigint La cantidad de bytes devueltos desde la capa Redshift Spectrum hasta el clúster. Una gran cantidad de datos devueltos a Amazon Redshift podría afectar el rendimiento del sistema.
files integer La cantidad de filas que se procesaron para esta consulta de Redshift Spectrum. Una pequeña cantidad de archivos limita los beneficios del procesamiento en paralelo.
files_max integer Cantidad total de archivos procesados en un sector.
files_avg integer Cantidad media de archivos procesados en un sector.
splits int Número de divisiones procesadas para este segmento. Número de divisiones procesadas en este sector. En el caso de los archivos de datos divisibles de gran tamaño (por ejemplo, archivos que superan los 512 MB), Redshift Spectrum intenta dividir los archivos en varias solicitudes de S3 para procesarlos en paralelo.
splits_max int Número máximo de divisiones procesadas en este sector.
splits_avg int Número medio de divisiones procesadas en este sector.
total_split_size bigint Tamaño total de todas las divisiones procesadas.
max_split_size bigint Tamaño máximo en bytes de las divisiones procesadas.
avg_split_size bigint Tamaño medio en bytes de las divisiones procesadas.
total_retries integer Cantidad total de reintentos para un archivo individual procesado.
max_retries integer Cantidad máxima de reintentos para cualquiera de los archivos procesados.
max_request_duration integer La duración máxima de una solicitud de un archivo individual (en microsegundos). Si las consultas tienen demasiado tiempo de ejecución, esto podría deberse a un cuello de botella.
avg_request_duration double precision La duración media de las solicitudes de archivo (en microsegundos).
max_request_parallelism integer La cantidad máxima de solicitudes en paralelo en un sector para esta consulta de Redshift Spectrum.
avg_request_parallelism double precision La cantidad promedio de solicitudes en paralelo en un sector para esta consulta de Redshift Spectrum.
total_slowdown_count bigint La cantidad total de solicitudes de Amazon S3 con un error de procesamiento lento que se produjeron durante el análisis de la tabla externa.
max_slowdown_count integer La cantidad máxima de solicitudes de Amazon S3 con un error de procesamiento lento que se produjeron durante el análisis de la tabla externa en un sector.

Consulta de ejemplo

En el siguiente ejemplo, se obtienen los detalles del paso de análisis para la última consulta completada.

select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0