SVL_S3QUERY_SUMMARY - Amazon Redshift

SVL_S3QUERY_SUMMARY

Use a visualização SVL_S3QUERY_SUMMARY para obter um resumo de todas as consultas do Amazon Redshift Spectrum (consultas S3) que foram executadas no sistema. A exibição SVL_S3QUERY_SUMMARY agrega os detalhes da SVL_S3QUERY no nível de segmento.

SVL_S3QUERY_SUMMARY é visível para todos os usuários. Os superusuários podem ver todas as linhas; usuários regulares podem ver somente seus próprios dados. Para ter mais informações, consulte Visibilidade de dados em tabelas e visualizações de sistema.

Alguns ou todos os dados nessa tabela também podem ser encontrados na exibição de monitoramento SYS SYS_EXTERNAL_QUERY_DETAIL. Os dados na exibição de monitoramento SYS são formatados para serem mais fáceis de usar e compreender. É recomendável usar a exibição de monitoramento SYS nas consultas.

Para SVCS_S3QUERY_SUMMARY, consulte SVCS_S3QUERY_SUMMARY.

Colunas da tabela

Nome da coluna Tipo de dados Descrição
userid inteiro O ID do usuário que gerou determinada entrada.
consulta inteiro O ID da consulta. Este valor pode ser usado para unir várias outras tabelas e exibições do sistema.
xid bigint O ID da transação.
pid inteiro O ID do processo.
segment inteiro O número do segmento. Uma consulta consiste em vários segmentos e cada segmento consiste em uma ou mais etapas.
etapa inteiro A etapa da consulta que foi executada.
starttime timestamp O horário (em UTC) de início da execução da consulta.
endtime timestamp O horário (em UTC) de término da consulta.
elapsed inteiro O tempo (em microssegundos) que levou para a consulta ser executada.
aborted inteiro Se uma consulta for interrompida pelo sistema ou cancelada pelo usuário, essa coluna terá o valor 1. Se a consulta foi executada até o final, essa coluna conterá 0.
external_table_name char(136) O formato interno do nome externo da tabela para a varredura da tabela externa.
file_format character(16) O formato de arquivo dos dados da tabela externa.
is_partitioned char(1) O valor true (t) indica que a tabela externa está particionada.
is_rrscan char(1) O valor true (t) indica que uma varredura restrita ao intervalo foi aplicada.
is_nested char(1) O valor true (t) indica que o tipo de dados da coluna aninhada é acessado.
s3_scanned_rows bigint O número de linhas digitalizadas do Amazon S3 e enviadas para a camada do Redshift Spectrum.
s3_scanned_bytes bigint O número de bytes verificados do Amazon S3 e enviados para a camada do Redshift Spectrum, com base em dados compactados.
s3query_returned_rows bigint O número de linhas retornadas da camada do Redshift Spectrum para o cluster.
s3query_returned_bytes bigint O número de bytes retornados da camada do Redshift Spectrum para o cluster. Uma grande quantidade de dados retornados ao Amazon Redshift pode afetar a performance do sistema.
files inteiro O número de arquivos que foram processados para esta consulta do Redshift Spectrum. Um número pequeno de arquivos limita os benefícios do processamento paralelo.
files_max inteiro O número máximo de arquivos processados em uma fatia.
files_avg inteiro O número médio de arquivos processados em uma fatia.
splits int O número de divisões processadas para este segmento. O número de divisões processadas nesta fatia. Com arquivos de dados grandes que podem ser divididos, por exemplo, arquivos de dados maiores do que 512 MB, o Redshift Spectrum tenta dividir os arquivos em várias solicitações do S3 para o processamento paralelo.
splits_max int O número máximo de divisões processadas nesta fatia.
splits_avg int O número médio de divisões processadas nesta fatia.
total_split_size bigint O tamanho total de todas as divisões processadas.
max_split_size bigint O tamanho máximo da divisão processada, em bytes.
avg_split_size bigint O tamanho médio da divisão processada, em bytes.
total_retries inteiro O número total de novas tentativas para um arquivo individual processado.
max_retries inteiro O número máximo de novas tentativas para os arquivos processados.
max_request_duration inteiro A duração máxima de uma solicitação de arquivo individual (em microssegundos). As consultas de longa duração podem indicar um gargalo.
avg_request_duration double precision A duração média das solicitações de arquivos (em microssegundos).
max_request_parallelism inteiro O número máximo de solicitações paralelas em uma fatia para esta consulta do Redshift Spectrum.
avg_request_parallelism double precision O número médio de solicitações paralelas em uma fatia para esta consulta do Redshift Spectrum.
total_slowdown_count bigint O número total de solicitações do Amazon S3 com um erro de desaceleração ocorrido durante a varredura da tabela externa.
max_slowdown_count inteiro O número máximo de solicitações do Amazon S3 com um erro de desaceleração que ocorreu durante a varredura de tabela externa em um slice.

Consulta de exemplo

O exemplo a seguir obtém os detalhes da etapa de varredura da última consulta concluída.

select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0