Utilizzo di tabelle di serie temporali - Amazon Redshift

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Utilizzo di tabelle di serie temporali

Se i tuoi file hanno un periodo di conservazione fisso, puoi organizzare i dati come una sequenza di tabelle di serie temporali. In questa sequenza, ogni tabella è identica all'altra ma contiene dati per differenti intervalli di tempo.

È possibile rimuovere facilmente i vecchi dati semplicemente eseguendo un DROP TABLE comando nelle tabelle corrispondenti. Questo approccio è molto più rapido rispetto all'esecuzione di un DELETE processo su larga scala e consente di evitare di dover eseguire un VACUUM processo successivo per recuperare spazio. Per nascondere il fatto che i dati sono memorizzati in tabelle diverse, puoi creare una UNION ALL vista. Quando elimini i vecchi dati, perfeziona la UNION ALL visualizzazione per rimuovere le tabelle eliminate. Analogamente, quando carichi nuovi periodi di tempo in nuove tabelle, aggiungi nuove tabelle alla vista. Per segnalare all'ottimizzatore di saltare la scansione sulle tabelle che non corrispondono al filtro di query, la definizione della vista filtra in base all'intervallo di date che corrisponde a ciascuna tabella.

Evita di avere troppe tabelle nella UNION ALL vista. Ogni ulteriore tabella aggiunge un tempo di elaborazione alla query. Non è necessario che le tabelle usino lo stesso intervallo di tempo. Ad esempio, potresti avere tabelle per periodi di tempo diversi (giornaliero, mensile e annuale).

Se utilizzi tabelle di serie temporali con una colonna timestamp per la chiave di ordinamento, carichi i dati nell'ordine della chiave di ordinamento. In questo modo, si elimina la necessità di eseguire un vacuum per riordinare i dati. Per ulteriori informazioni, consulta Carica i tuoi dati nell'ordine della chiave di ordinamento.