STL_FILE_SCAN
Retorna os arquivos que o Amazon Redshift leu ao carregar dados usando o comando COPY.
Consultar esta visualização pode ajudar a solucionar erros de carregamento de dados. STL_FILE_SCAN pode ser particularmente útil para identificar problemas em carregamentos de dados paralelos, porque carregamentos de dados paralelos normalmente carregam muitos arquivos com um único comando COPY.
STL_FILE_SCAN permanece visível para todos os usuários. Os superusuários podem ver todas as linhas; usuários regulares podem ver somente seus próprios dados. Para ter mais informações, consulte Visibilidade de dados em tabelas e visualizações de sistema.
nota
STL_FILE_SCAN só contém consultas executadas em clusters principais. Ele não contém consultas executadas em clusters de escalabilidade de simultaneidade. Para acessar consultas executadas em clusters de escalabilidade principais e de simultaneidade, é recomendável usar a exibição de monitoramento SYS SYS_LOAD_DETAIL. Os dados na exibição de monitoramento SYS são formatados para serem mais fáceis de usar e compreender.
Colunas da tabela
Nome da coluna | Tipo de dados | Descrição |
---|---|---|
userid | inteiro | O ID do usuário que gerou a entrada. |
consulta | inteiro | ID da consulta. A coluna de consulta pode ser usada para unir outras tabelas e exibições do sistema. |
slice | inteiro | O número que identifica a fatia em que a consulta estava sendo executada. |
name | character(90) | O caminho completo e o nome do arquivo que foi carregado. |
lines | bigint | O número de linhas lidas do arquivo. |
bytes | bigint | O número de bytes lidos do arquivo. |
loadtime | bigint | O tempo gasto no carregamento do arquivo (em microssegundos). |
curtime | Timestamp | Timestamp que representa a hora em que o Amazon Redshift começou a processar o arquivo. |
is_parcial | inteiro | Valor que, se true (1), indica que o arquivo de entrada é dividido em intervalos durante uma operação COPY. Se esse valor for false (0), o arquivo de entrada não será dividido. |
start_offset | bigint | Valor que, se o arquivo de entrada for dividido durante uma operação COPY, indica o valor de deslocamento da divisão (em bytes). Se o arquivo não estiver dividido, esse valor será 0. |
Consultas de exemplo
A consulta a seguir recupera os nomes e tempos de carregamento de todos os arquivos que o Amazon Redshift levou mais de 1.000.000 de microssegundos para ler.
select trim(name)as name, loadtime from stl_file_scan where loadtime > 1000000;
Essa consulta retorna os dados de saída de exemplo a seguir.
name | loadtime ---------------------------+---------- listings_pipe.txt | 9458354 allusers_pipe.txt | 2963761 allevents_pipe.txt | 1409135 tickit/listings_pipe.txt | 7071087 tickit/allevents_pipe.txt | 1237364 tickit/allusers_pipe.txt | 2535138 listings_pipe.txt | 6706370 allusers_pipe.txt | 3579461 allevents_pipe.txt | 1313195 tickit/allusers_pipe.txt | 3236060 tickit/listings_pipe.txt | 4980108 (11 rows)