順次ブロックでのデータのロード - Amazon Redshift

順次ブロックでのデータのロード

大量のデータを追加する必要がある場合、ソート順序に基づいて順次ブロックでデータをロードすればバキュームの必要性がなくなります。

例えば、2017 年 1 月から 2017 年 12 月までのイベントのあるテーブルをロードする必要があるとします。各月が 1 つのファイルに含まれていると仮定して、1 月、2 月などと、行をロードします。ロードが完了したとき、テーブルは完全にソートされています。バキュームを実行する必要はありません。詳細については、「時系列テーブルの使用」を参照してください。

非常に大量のデータセットをロードするとき、ソートに必要な領域が利用可能な領域の合計を超えることがあります。小さなブロックでデータをロードすれば、各ロードの際、中間のソート領域が少なくて済みます。また、小さなブロックをロードする場合、COPY が失敗してロールバックされるときに簡単に再開できます。