SVL_S3QUERY_SUMMARY
Use a visualização SVL_S3QUERY_SUMMARY para obter um resumo de todas as consultas do Amazon Redshift Spectrum (consultas S3) que foram executadas no sistema. A exibição SVL_S3QUERY_SUMMARY agrega os detalhes da SVL_S3QUERY no nível de segmento.
SVL_S3QUERY_SUMMARY é visível para todos os usuários. Os superusuários podem ver todas as linhas; usuários regulares podem ver somente seus próprios dados. Para ter mais informações, consulte Visibilidade de dados em tabelas e visualizações de sistema.
Alguns ou todos os dados nessa tabela também podem ser encontrados na exibição de monitoramento SYS SYS_EXTERNAL_QUERY_DETAIL. Os dados na exibição de monitoramento SYS são formatados para serem mais fáceis de usar e compreender. É recomendável usar a exibição de monitoramento SYS nas consultas.
Para SVCS_S3QUERY_SUMMARY, consulte SVCS_S3QUERY_SUMMARY.
Colunas da tabela
Nome da coluna | Tipo de dados | Descrição |
---|---|---|
userid | inteiro | O ID do usuário que gerou determinada entrada. |
consulta | inteiro | O ID da consulta. Este valor pode ser usado para unir várias outras tabelas e exibições do sistema. |
xid | bigint | O ID da transação. |
pid | inteiro | O ID do processo. |
segment | inteiro | O número do segmento. Uma consulta consiste em vários segmentos e cada segmento consiste em uma ou mais etapas. |
etapa | inteiro | A etapa da consulta que foi executada. |
starttime | timestamp | O horário (em UTC) de início da execução da consulta. |
endtime | timestamp | O horário (em UTC) de término da consulta. |
elapsed | inteiro | O tempo (em microssegundos) que levou para a consulta ser executada. |
aborted | inteiro | Se uma consulta for interrompida pelo sistema ou cancelada pelo usuário, essa coluna terá o valor 1 . Se a consulta foi executada até o final, essa coluna conterá 0 . |
external_table_name | char(136) | O formato interno do nome externo da tabela para a varredura da tabela externa. |
file_format | character(16) | O formato de arquivo dos dados da tabela externa. |
is_partitioned | char(1) | O valor true (t ) indica que a tabela externa está particionada. |
is_rrscan | char(1) | O valor true (t ) indica que uma varredura restrita ao intervalo foi aplicada. |
is_nested | char(1) | O valor true (t ) indica que o tipo de dados da coluna aninhada é acessado. |
s3_scanned_rows | bigint | O número de linhas digitalizadas do Amazon S3 e enviadas para a camada do Redshift Spectrum. |
s3_scanned_bytes | bigint | O número de bytes verificados do Amazon S3 e enviados para a camada do Redshift Spectrum, com base em dados compactados. |
s3query_returned_rows | bigint | O número de linhas retornadas da camada do Redshift Spectrum para o cluster. |
s3query_returned_bytes | bigint | O número de bytes retornados da camada do Redshift Spectrum para o cluster. Uma grande quantidade de dados retornados ao Amazon Redshift pode afetar a performance do sistema. |
files | inteiro | O número de arquivos que foram processados para esta consulta do Redshift Spectrum. Um número pequeno de arquivos limita os benefícios do processamento paralelo. |
files_max | inteiro | O número máximo de arquivos processados em uma fatia. |
files_avg | inteiro | O número médio de arquivos processados em uma fatia. |
splits | int | O número de divisões processadas para este segmento. O número de divisões processadas nesta fatia. Com arquivos de dados grandes que podem ser divididos, por exemplo, arquivos de dados maiores do que 512 MB, o Redshift Spectrum tenta dividir os arquivos em várias solicitações do S3 para o processamento paralelo. |
splits_max | int | O número máximo de divisões processadas nesta fatia. |
splits_avg | int | O número médio de divisões processadas nesta fatia. |
total_split_size | bigint | O tamanho total de todas as divisões processadas. |
max_split_size | bigint | O tamanho máximo da divisão processada, em bytes. |
avg_split_size | bigint | O tamanho médio da divisão processada, em bytes. |
total_retries | inteiro | O número total de novas tentativas para um arquivo individual processado. |
max_retries | inteiro | O número máximo de novas tentativas para os arquivos processados. |
max_request_duration | inteiro | A duração máxima de uma solicitação de arquivo individual (em microssegundos). As consultas de longa duração podem indicar um gargalo. |
avg_request_duration | double precision | A duração média das solicitações de arquivos (em microssegundos). |
max_request_parallelism | inteiro | O número máximo de solicitações paralelas em uma fatia para esta consulta do Redshift Spectrum. |
avg_request_parallelism | double precision | O número médio de solicitações paralelas em uma fatia para esta consulta do Redshift Spectrum. |
total_slowdown_count | bigint | O número total de solicitações do Amazon S3 com um erro de desaceleração ocorrido durante a varredura da tabela externa. |
max_slowdown_count | inteiro | O número máximo de solicitações do Amazon S3 com um erro de desaceleração que ocorreu durante a varredura de tabela externa em um slice. |
Consulta de exemplo
O exemplo a seguir obtém os detalhes da etapa de varredura da última consulta concluída.
select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files ------+---------+---------+-----------------+------------------+-----------------------+------------------------+------ 4587 | 2 | 67811 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 591568 | 172462 | 11260097 | 8513 | 170260 | 1 4587 | 2 | 216849 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 216671 | 0 | 0 | 0 | 0 | 0