STL_FILE_SCAN
Retorna os arquivos que o Amazon Redshift leu ao carregar dados usando o comando COPY.
Consultar esta visualização pode ajudar a solucionar erros de carregamento de dados. STL_FILE_SCAN pode ser particularmente útil para identificar problemas em carregamentos de dados paralelos, porque carregamentos de dados paralelos normalmente carregam muitos arquivos com um único comando COPY.
STL_FILE_SCAN permanece visível para todos os usuários. Os superusuários podem ver todas as linhas; usuários regulares podem ver somente seus próprios dados. Para ter mais informações, consulte Visibilidade de dados em tabelas e visualizações de sistema.
nota
STL_FILE_SCAN contém apenas as consultas executadas nos principais clusters provisionados. Ele não contém consultas executadas em clusters de escalabilidade simultânea ou em namespaces sem servidor. Para acessar os planos de explicação das consultas executadas em clusters principais, clusters de escalabilidade simultânea e namespaces sem servidor, recomendamos usar a visualização de monitoramento SYS SYS_LOAD_DETAIL. Os dados na exibição de monitoramento SYS são formatados para serem mais fáceis de usar e compreender.
Colunas da tabela
Nome da coluna | Tipo de dados | Descrição |
---|---|---|
userid | integer | O ID do usuário que gerou a entrada. |
consulta | integer | ID da consulta. A coluna de consulta pode ser usada para unir outras tabelas e exibições do sistema. |
slice | integer | O número que identifica a fatia em que a consulta estava sendo executada. |
nome | character(90) | O caminho completo e o nome do arquivo que foi carregado. |
lines | bigint | O número de linhas lidas do arquivo. |
bytes | bigint | O número de bytes lidos do arquivo. |
loadtime | bigint | O tempo gasto no carregamento do arquivo (em microssegundos). |
curtime | Timestamp | Timestamp que representa a hora em que o Amazon Redshift começou a processar o arquivo. |
is_parcial | integer | Valor que, se true (1), indica que o arquivo de entrada é dividido em intervalos durante uma operação COPY. Se esse valor for false (0), o arquivo de entrada não será dividido. |
start_offset | bigint | Valor que, se o arquivo de entrada for dividido durante uma operação COPY, indica o valor de deslocamento da divisão (em bytes). Se o arquivo não estiver dividido, esse valor será 0. |
Consultas de exemplo
A consulta a seguir recupera os nomes e tempos de carregamento de todos os arquivos que o Amazon Redshift levou mais de 1.000.000 de microssegundos para ler.
select trim(name)as name, loadtime from stl_file_scan
where loadtime > 1000000;
Essa consulta retorna os dados de saída de exemplo a seguir.
name | loadtime
---------------------------+----------
listings_pipe.txt | 9458354
allusers_pipe.txt | 2963761
allevents_pipe.txt | 1409135
tickit/listings_pipe.txt | 7071087
tickit/allevents_pipe.txt | 1237364
tickit/allusers_pipe.txt | 2535138
listings_pipe.txt | 6706370
allusers_pipe.txt | 3579461
allevents_pipe.txt | 1313195
tickit/allusers_pipe.txt | 3236060
tickit/listings_pipe.txt | 4980108
(11 rows)